第一次抓取网页, slash 都变成\u002F, 求助

来源:15-1 获得初始页面内容

慕UI4464388

2020-04-03

抓取的web link内容都有\u002F,应该是\被replace 了,这是什么原因啊?
有没有更好的解决办法

{"linkContent":"平凉","linkURL":"http:\u002F\u002Fwww.zhenai.com\u002Fzhenghun\u002Fpingliang"},{"linkContent":"萍乡","linkURL":"http:\u002F\u002Fwww.zhenai.com\u002Fzhenghun\u002Fpingxiang2"},{"linkContent":"浦东新","linkURL":"http:\u002F\u002Fwww.zhenai.com\u002Fzhenghun\u002Fpudongxin"},{"linkContent":"普洱","linkURL":"http:\u002F\u002Fwww.zhenai.com\u002Fzhenghun\u002Fpuer"},{"linkContent":"莆田","linkURL":"http:\u002F\u002Fwww.zhenai.com\u002Fzhenghun\u002Fputian"},{"linkContent":"普陀","linkURL":"http:\u002F\u002Fwww.zhenai.com\u002Fzhenghun\u002Fputuo"},{"linkContent":"濮阳","linkURL":"http:\u002F\u002Fwww.zhenai.com\u002Fzhenghun\u002Fpuyang1"}],"order":"P"}

Code

func main() {
	resp, err := http.Get("http://www.zhenai.com/zhenghun")
	if err != nil {
		panic(err)
	}
	defer resp.Body.Close()

	if resp.StatusCode == http.StatusOK {
		all, err := ioutil.ReadAll(resp.Body)
		if err != nil {
			panic(err)
		}
		fmt.Printf("%s\n", all)
	}
}
写回答

1回答

ccmouse

2020-04-06

可以用浏览器右键,查看源代码验证。我们发现的确是有很多转义过的\u002F,说明我们的代码没问题。

那这里我们可以不用理会,因为还有很多没转义过的<a href=...之类的可以使用。

另外,为了防止这种第三方的改变对课程造成的不连贯性,我做了个模拟相亲网站,可以参考14-5 模拟相亲网站上线啦!

1
0

Google资深工程师深度讲解Go语言 由浅入深掌握Go语言

语法+分布式爬虫实战 为转型工程师量身打造

5995 学习 · 1909 问题

查看课程