问答题X 纠错
聚焦爬虫需要根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接,并将其放入等待抓取的URL 队列。然后,它将根据一定的搜索策略从队列中选择下一步要抓取的网页URL ,并重复上述过程,直到达到系统的某一条件时停止。
你可能喜欢
问答题
多项选择题
A.根据一定的搜索策略,从URL 队列中选择下一步要抓取的网页URL
B.我们需要根据爬取需求定义聚焦爬虫的爬取目标,并进行相关的描述
C.聚焦爬虫会根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接
D.有用的链接会放入等待抓取的URL 队列