数据库中的content内容与es中的不同

来源:6-20 保存数据到mysql中 -2

战战的坚果

2019-06-09

老师,知乎问题的content爬取,按照您课上的截图,您获取的content如下:图片描述

在数据库中的content内容显示的时候有下面这种标签,
<div class="QuestionHeader-detail"> <div class="QuestionRichText QuestionRichText--expandable QuestionRichText--collapsed"><div><span class="RichText ztext" itemprop="text"></span><button type="button" class="Button QuestionRichText-more Button--plain"><svg viewbox="0 0 10 6" class="Icon QuestionRichText-more-icon Icon--arrow" style="height:16px;width:10px" width="10" height="16" aria-hidden="true"><title></title><g><path d="M8.716.217L5.002 4 1.285.218C.99-.072.514-.072.22.218c-.294.29-.294.76 0 1.052l4.25 4.512c.292.29.77.29 1.063 0L9.78 1.27c.293-.29.293-.76 0-1.052-.295-.29-.77-.29-1.063 0z"></path></g></svg></button></div></div></div>
但是在es中显示时,就没有这些tag标签了呢,如下图:

图片描述

写回答

1回答

bobby

2019-06-11

入库es的时候有没有自己去掉这些tag? 以及你可以使用kibana查询一条数据看看kibana中显示的数据是不是有html的标签?

0
2
bobby
回复
战战的坚果
那就在入口es的时候不要去掉tag就行了
2019-06-14
共2条回复

Scrapy打造搜索引擎 畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎

5795 学习 · 6290 问题

查看课程