首页课程实战体系课手记专栏慕课教程

关于有的文章获取不到导致入不了数据库的问题

来源：4-19 pipeline数据库保存

碳基打工人

2021-04-02

同学们注意有的图片的地址是
这样的
里面的图片地址是//开头而不是 https:开头这就导致有的文章数据能入库有的程序报错入不了
这就需要我们手动判断添加了
代码如下

有的照片以https 开头有的是以//开头但是//开头程序报错因为配置的pip里面一定要是list

            # 所以图片的保存在list中
            str_image_p = response.meta.get("front_image_url", "")
            if not str_image_p.startswith("http"):
                str_image_p = "https:" + str_image_p
            article_item["front_image_url"] = [str_image_p]

写回答

1回答

碳基打工人

碳基打工人

提问者

2021-04-02

<img src="//images0.cnblogs.com/news_topic/ITblog.jpg" class="topic_img" alt="">

0

1

bobby

这里我在本章的最后一节课中有提到关于图片url的问题

2021-04-05

共1条回复

Scrapy打造搜索引擎畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy，用Django+Elasticsearch搭建搜索引擎

5820 学习 · 6291 问题

相似问题

内容管理平台数据抓取，深度优先模式抓取问题

回答 3

为什么知乎数据导入不到MySQL数据库中？

回答 3

异步插入数据库后怎么没关闭数据库，数据库不会溢出吗？

回答 1

关于数据发布的问题

回答 1

老师，就是这页数据还没有获取完就自动进入下一页了，然后获取了十几条数据就报错了，然后就报302的错，点击302的连接页面就显示你已经登录，老师，这个需要怎么做呢

回答 3

打开慕课网App查看更多内容