第一次抓取网页, slash 都变成\u002F, 求助
来源:15-1 获得初始页面内容
慕UI4464388
2020-04-03
抓取的web link内容都有\u002F,应该是\被replace 了,这是什么原因啊?
有没有更好的解决办法
{"linkContent":"平凉","linkURL":"http:\u002F\u002Fwww.zhenai.com\u002Fzhenghun\u002Fpingliang"},{"linkContent":"萍乡","linkURL":"http:\u002F\u002Fwww.zhenai.com\u002Fzhenghun\u002Fpingxiang2"},{"linkContent":"浦东新","linkURL":"http:\u002F\u002Fwww.zhenai.com\u002Fzhenghun\u002Fpudongxin"},{"linkContent":"普洱","linkURL":"http:\u002F\u002Fwww.zhenai.com\u002Fzhenghun\u002Fpuer"},{"linkContent":"莆田","linkURL":"http:\u002F\u002Fwww.zhenai.com\u002Fzhenghun\u002Fputian"},{"linkContent":"普陀","linkURL":"http:\u002F\u002Fwww.zhenai.com\u002Fzhenghun\u002Fputuo"},{"linkContent":"濮阳","linkURL":"http:\u002F\u002Fwww.zhenai.com\u002Fzhenghun\u002Fpuyang1"}],"order":"P"}
Code
func main() {
resp, err := http.Get("http://www.zhenai.com/zhenghun")
if err != nil {
panic(err)
}
defer resp.Body.Close()
if resp.StatusCode == http.StatusOK {
all, err := ioutil.ReadAll(resp.Body)
if err != nil {
panic(err)
}
fmt.Printf("%s\n", all)
}
}
写回答
1回答
-
ccmouse
2020-04-06
可以用浏览器右键,查看源代码验证。我们发现的确是有很多转义过的\u002F,说明我们的代码没问题。
那这里我们可以不用理会,因为还有很多没转义过的<a href=...之类的可以使用。
另外,为了防止这种第三方的改变对课程造成的不连贯性,我做了个模拟相亲网站,可以参考14-5 模拟相亲网站上线啦!
10
相似问题