中易网

怎么创建自己的搜索引擎呢???

答案:2  悬赏:0  
解决时间 2021-02-02 07:12
怎么创建自己的搜索引擎呢???
最佳答案
【工作原理】   1、抓取网页   每个独立的搜索引擎都有自己的网页抓取程序(spider)。Spider顺着网页中的超链接,连续地抓取网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。   2、处理网页   搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复网页、分析超链接、计算网页的重要度。   3、提供检索服务   用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。
搜索引擎一般由搜索器、索引器、检索器和用户接口四个部分组成:   ①搜索器:其功能是在互联网中漫游,发现和搜集信息;   ②索引器:其功能是理解搜索器所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表;   ③检索器:其功能是根据用户的查询在索引库中快速检索文档,进行相关度评价,对将要输出的结果排序,并能按用户的查询需求合理反馈信息;   ④用户接口:其作用是接纳用户查询、显示查询结果、提供个性化查询项。 做搜索引擎不是一天两天就能的,你好很多很多服务器,然后检索网络,制成一个信息库,所以你要很好的软件支持,资金投入也是很大的
全部回答
【工作原理】 1、抓取网页 每个独立的搜索引擎都有自己的网页抓取程序(spider)。spider顺着网页中的超链接,连续地抓取网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。 2、处理网页 搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复网页、分析超链接、计算网页的重要度。 3、提供检索服务 用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和url外,还会提供一段来自网页的摘要以及其他信息。 搜索引擎一般由搜索器、索引器、检索器和用户接口四个部分组成: ①搜索器:其功能是在互联网中漫游,发现和搜集信息; ②索引器:其功能是理解搜索器所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表; ③检索器:其功能是根据用户的查询在索引库中快速检索文档,进行相关度评价,对将要输出的结果排序,并能按用户的查询需求合理反馈信息; ④用户接口:其作用是接纳用户查询、显示查询结果、提供个性化查询项。
我要举报
如以上问答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
豪杰oscar 82音箱好吗?当年售价多少?喇叭用
请问我现在把唯一的房子卖掉,再买,首付几成
我和女朋友分手后,她的QQ网名换成 他说。这
兰芝水酷激活保湿使用步骤
喝酵素能喝咖啡吗
想买一个车,不超过15万。年轻人25岁。选什么
中国有多少日本人现在,北京呢
天正建筑2013的注册码N00235ACD14A1020054554
瑞士美度表在什么地方啊,我要过去处理事情
imp system/manager@TEST file=d:\daochu.dmp
已知-1<cosA<(根号2-1)/2,求A的取值范围
美味点心店地址在什么地方,想过去办事
怎么在php的页面中调用mysql的某个数据?代码
由于个人原因工作没做好带我的师傅直接辞退我
牛贵坪在哪里啊,我有事要去这个地方
推荐资讯
怪物猎人ol怎么领10800点券 10800点券在哪领
屋里的窗户为何会有水珠
心里一肚子苦水用成语形容?
地球上“连体”的人活得最久的是多少岁?
了不得食品在什么地方啊,我要过去处理事情
主持人上场常用音乐?要经典的!!
小孩学画画,一年要花多少钱啊?
安装Mathtype 6.5后,运行程序后出现没有找到
农家鲜酒楼在哪里啊,我有事要去这个地方
冷了又冷猜一明星答案是什么
脖子后面有痣好吗
Cannot connect virtual device ide1:0 becau
手机登qq时,显示手机磁盘不足,清理后重新登
刺客的套装怎么选啊?