A.url中不能包含#,所以这是一个错误的url格式B.用python3中使用requesets想此url发起一次请求,就可以直接获取到真正的数据C.可以在chrome浏览器中访问此url,再结合chrome检查工具分析,访问这个url后还有哪些异步请求获取真正的数据
A.如果想抓取新浪网站体育频道下的信息,则按照版块定制抓取会比较好B.根据需求抓取特定的内容,比如抓视频,图片等C.百科比较适合根据网站的特定结构来抓取D.不能利用百度搜索引擎抓取数据
A.万维网的深度并没有很深,一个网页有很多路径可以到达B.一般来说热点新闻类重要的网页距离种子站点比较远C.对于一些特殊需求,需要使用深度限制与宽度优先相结合