直接访问知乎的API,获取问题的数据时,遇到401

来源:6-13 知乎分析以及数据表设计 - 2

慕雪0267781

2017-11-10

 "http://www.zhihu.com/api/v3/feed/topstory?before_id=59&limit=10&session_token=b0738524ecd187a27c3d7fb52a05377a&action=pull&action_feed=True&desktop=true"

我发现知乎的数据是用ajax,动态填充的,并不是静态的网页。 在抓取知乎提问的相关数据时,我发现前端的ajax是从上面这个地方取的数据。 然而我自己带着cookie取访问这个API时,还是遇到401。 

https://www.zhihu.com/api/v4/questions/28530832/answers?sort_by=default&include=data%5B%2A%5D.is_normal%2Cadmin_closed_comment%2Creward_info%2Cis_collapsed%2Cannotation_action%2Cannotation_detail%2Ccollapse_reason%2Cis_sticky%2Ccollapsed_by%2Csuggest_edit%2Ccomment_count%2Ccan_comment%2Ccontent%2Ceditable_content%2Cvoteup_count%2Creshipment_settings%2Ccomment_permission%2Ccreated_time%2Cupdated_time%2Creview_info%2Cquestion%2Cexcerpt%2Crelationship.is_authorized%2Cis_author%2Cvoting%2Cis_thanked%2Cis_nothelp%2Cupvoted_followees%3Bdata%5B%2A%5D.mark_infos%5B%2A%5D.url%3Bdata%5B%2A%5D.author.follower_count%2Cbadge%5B%3F%28type%3Dbest_answerer%29%5D.topics&limit=20&offset=23

但是这个API,带着cookie就可以直接拿到回答的数据。 

写回答

1回答

bobby

2017-11-10

你是否请求过快 一般请求过快服务器都会针对账号或者ip进行限制的

0
2
bobby
回复
慕雪0267781
restful api中401的意思是未授权 表示你没有登录的情况下访问了某个接口, 应该是你的cookie过期了 或者没有带cookie过去造成的
2017-11-13
共2条回复

Scrapy打造搜索引擎 畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎

5796 学习 · 6290 问题

查看课程