推广 热搜： 行业机械设备杯系统教师经纪参数金蒸汽

百度请放心，AI搜索还取代不了你

日期：2024-11-10 移动：http://fhzcwj.xhstdz.com/mobile/quote/992.html

百度请放心，AI搜索还取代不了你

　　「体验完这个国产AI搜索，我想说传统搜索引擎可以靠边了」

　　「AI搜索，革了旧引擎的命」

　　「搜索引擎要变天了」

　　「首款国产AI搜索引擎横空出世，革了传统搜索引擎的命！无限追问，告别广告」

　　这是几则近期的文章标题。不用看全文，就已经感觉到AI搜索扑面而来的杀气――传统搜索引擎，似乎就要成为生成式AI的下一个刀下之鬼了。

　　毫无疑问，2024年最热门的科技赛道，AI搜索一定是排名靠前的。自2022年末的生成式AI大爆炸以来，这条赛道就一直络绎不绝，人满为患。

　　7月25日，曾经跳票过的OpenAI终于宣布开放自家AI搜索引擎SearchGPT的内测。

　　而仅在国内，近一个月就有两个新玩家涌入。6月30日，知乎宣布推出AI搜索产品「知乎直答」，宣称要探索提问的全新形态，帮助用户“用提问发现世界”；7月10日，阿里旗下的夸克也推出了AI搜索，主打一个“能搜索、能创作、能总结的超级搜索框”概念。

　　加上之前已经入局的秘塔AI搜索、KIMI、360AI搜索、的天工AI、Genspark等等，AI搜索进入战国时代。

　　事实上，AI搜索听起来高精尖，但是门槛并不高，不仅大厂和初创企业染指，连个人开发者也能挤进来。

　　据报道，阿里前高管贾扬清用500行代码就写了一个AI搜索引擎；独立开发者「艾逗笔」花了一个周末就写了AI搜索ThinkAny，三个月时间做到了月访问量60万。

　　但这么低的门槛，钱景却无限。进入2024年，此中翘楚Perplexity的估值连连跳涨，从1月份的5亿美元，暴增到30亿美元。

　　但是，AI搜索，真的会革掉传统搜索引擎的命吗？

　　答案是，还早着呢。

　　业内最早布局AI搜索的微软必应，从去年二月推出New Bing以来，到2024年1月整整一年的时间，Bing的全球市场份额从2.81％上升到3.43％，增长只有0.62％。AI没帮到一点，一开始紧张不已的谷歌，也松了一口气。

　　投资了秘塔AI搜索的猎豹移动董事长傅盛在一次专访中坦言，“只要大厂不犯重大错误，大搜索格局上，很难有大的变化。”

　　傅盛的断言并非信口开河。AI搜索至少要越过三个坎――足够高的准确性、足够低的成本和足够成熟的商业模式，才能勉强跟传统搜索引擎掰掰手腕。

　　目前，我们所说的AI搜索主要有三类产品形态。一类是具备检索增强生成（RAG）能力的聊天，比如ChatGPT、文心一言、Kimi等。

　　第二类是专门做 AI 搜索的产品，有搜索框和搜索详情页，比如 Perplexity、秘塔AI搜索。

　　还有一类是将传统搜索和AI结合在一起，主要形式是在搜索结果页首条加上AI生成的答案，比如谷歌的AI Overview和百度的AI智能回答。

　　本文探讨的主要是后两种。

　　AI搜索的嘴，骗人的鬼

　　今年5月，谷歌推出了自家的AI Overviews，也就是在谷歌搜索结果页的首条，展现由谷歌大语言模型Gemini生成的答案。

　　但刚推出就翻车了，网友发现谷歌的AI答案常常不着边际。

　　网友问披萨上的芝士容易脱落怎么办，谷歌AI的回答是“要加上八分之一杯的胶水”；网友问每天应该吃多少石头时，谷歌AI给出建议“每天至少吃一块小石头”；网友表示自己心情沮丧，谷歌AI建议从金门大桥上跳下去。

　　即便是强如OpenAI，也堵不住SearchGPT的胡说八道。官方演示视频里，在回答某音乐节的相关问题时，SearchGPT给出了错误的购票日期，OpenAI官方已承认了这个错误，并表示“这只是初始的原型，我们会不断改进。”

　　业界领头羊尚且如此，国内众多AI搜索更不用说。往往只需要略施小计，就能让AI搜索犯错。

　　《真故研究室》在测试天工AI搜索时中，故意把美国畅销小说作家史蒂芬?金的国籍说成英国，天工AI便不假思索给史蒂芬?金办了移民。

　　而昆仑万维董事长兼CEO方汉就在前不久的一次访谈中直言不讳称：“我认为AI搜索首先是没有幻觉问题的，因为从技术原理上来说，它是先搜索再总结，然后再通过智能体去处理。在这个流程过程中，我们从源头杜绝了这个欺诈的问题。”

　　但是，他旗下的天工AI搜索，却在显著位置标注了“内容由AI生成，不能保证真实”的字样。

　　AI搜索的很多错误，有的很明显，但最糟糕的是有的深埋在文案中，防不胜防。

　　《真故研究室》在百度上随意搜了一个词条，看似没有问题，但AI答案说梅西获得了七次金球奖，事实上梅西2023年获得了第八座金球奖。

　　AI搜索界的头号种子选手Perplexity，胡说八道的概率也不低。在《真故研究室》提出的一个问题里，它连普通人百度一下就能搜到的百度财报数据也无法提供。

　　美国科技杂志《连线》（Wired）也进行了测试，也发现Perplexity是说谎惯犯。

　　记者临时新建了一个网页，上面只有一句话「我是《连线》杂志记者」，然后让Perplexity总结网页内容。

　　结果Perplexity“脑洞大开”，直接编了一个童话故事。此外，针对各类新闻事件，Perplexity也常常张冠李戴无中生有，比如让一名加州警察蒙冤犯了罪，给人物编造直接引语等等。

　　统计学的结果，也与经验相吻合。一篇论文发现，AI搜索看上去富含信息量，但常常掺杂没有论据的观点和不正确的引用。在Perplexity等AI搜索中，AI生成的论点，仅有51.5％有参考链接支持，援引的参考链接，只有74.5％支持其论点。

　　也就是说，AI搜索结果的正确性，充其量也就5到7成而已。你搜索十次，可能有五次的结果都有问题。这么高的错误率，让人不得不挨个点击链接，复查结果的准确性。但我既然都要一个个点开链接了，跟传统的搜索又有什么区别呢。

　　幻觉是大语言模型的劣根性

　　AI搜索产生的错误，在业内被称为“幻觉”。幻觉是大语言模型的劣根性，就像说谎是男人的劣根性，甚至有学者和业内人士悲观地表示，或许大模型永远也解决不了幻觉问题。

　　这与大语言模型的原理有关。大模型并不理解人类和事物，它的核心运行法则是通过预测下一个字词的出现概率而生成文本。

　　直白点说，大模型就是台概率机器，并不关注真相或事实，本质上是一只模仿能力极强的鹦鹉，可以模仿人类的说话方式，但并不理解人类说的是什么。

　　正如知识计算引擎Wolfram Alpha的主要设计师、科学家斯蒂芬?沃尔夫拉姆所言，大语言模型本质上是就文本生成“合理的延续”，所谓“合理”是指，“人们在看到诸如数十亿个网页上的内容后，可能期待别人会这样写”，而不是事实，就像很多人只是想活成别人期待的样子，但那并不一定是真实的自己。

　　为了解决大模型“幻觉”，AI搜索引入了检索增强生成（Retrieval-augmented Generation，简称RAG）技术：在回答问题之前，先从网络或资料库检索相关信息，然后结合检索到的信息生成文本，提高内容的准确性。

　　这样的手段确实可以一定程度上减轻大语言模型的幻觉，但效果并没有传说中的那么好。比如有研究发现，即使是接入了计算引擎 Wolfram Alpha，ChatGPT的数学能力也只是稍微增强，出错依然是常态；ChatGPT在使用接入了医学资料库后，还是常常捏造信息。

　　从某种程度上，RAG反而增加了人类辨别真伪的难度。接入数据库，只是让大模型看起来更专业，模仿得更像数据库里的内容。

　　RAG加持的AI搜索，还面临一个要命的问题，无法辨别信源的优劣真伪。

　　谷歌的AI Overviews之所以出现这么多啼笑皆非的答案，一部分原因就是分不清来源的真假，比如谷歌AI让网友用胶水涂在披萨上的建议，就是从10多年前美国贴吧Reddit上的一则评论学来的，那条评论显然是在开玩笑。

　　不仅无法判定真伪，AI搜索甚至无法判定信息源是不是AI内容。

　　有人做了一个实验，从Perplexity的推荐条目、旅游、科技AI三个领域各抽取五条搜索提示词，每次输入搜索提示词后，就点击“相关推荐”栏的内容，直到参考链接里出现AI文章为止。结果是：在科技AI领域，只需要一次搜索就准能碰到参考链接出现AI文章，其他两类普遍也是在1到3次就会出现引用AI文章的情况。

　　用AI文章，生成AI答案，AI形成了自产自销的内容闭环。《福布斯》杂志不客气地将这种现象称为“垃圾进，垃圾出”（Garbage In, Garbage Out）。

　　先驯服大模型这头吞金兽

　　大模型是头吞金兽，已经是业内的共识。挑战传统搜索，得先把自己的成本打下来。

　　谷歌母公司Alphabet的董事会主席约翰?轩尼诗在去年初表示，大语言模型每一次互动的成本可能比传统搜索要高10倍。

　　摩根士丹利的分析师估计，如果AI为谷歌50%的搜索关键词生成50字的答案，每年可能会让谷歌多付出60亿美元的成本。

　　有数据显示，传统搜索的成本是0.2美分左右。OpenAI的CEO山姆?曼2022年底曾在社交网站X上透露，ChatGPT平均每次对话的计算成本在10美分以内。也有数据表明，AI搜索成本介于3至30美分之间。

　　成本高可能是谷歌和百度在AI搜索上步子不敢迈得太大的原因之一，另一个原因是传统搜索引擎赚钱太容易了，轻易不敢让商业化前景并不明朗的AI搜索，影响主业的收入。

　　搜索引擎带来的广告收入始终是两大搜索巨头的主要收入来源。广告占谷歌总收入的一半以上；近年来迟迟没找到第二曲线的百度则更高，2024年第一季度的在线营销（基本可等同于搜索引擎广告）收入占其核心收入达71%。

　　所以，谷歌直到今年5月才正式在搜索中加入生成式AI，起初官宣的范围是15％的搜索结果，但到了7月，下降到了7％。

　　大洋这一侧的百度也差不多，虽然在2023年的百度世界大会上，李彦宏高调喊出“百度新搜索”，但实际落地则保守很多。

　　“百度新搜索”并没有在百度APP中大规模上线。可能是为了配合老板的PR，百度业务部门只在旗下的“简单搜索”App上推出了完整功能。

　　“简单搜索”是无广告版百度搜索，使用量级很小，除了大会宣传期外，“简单搜索”鲜少出现在百度的官方传播物料里。

　　这说明，在没有找到合适的商业化路径之前，百度不敢破釜沉舟，砸掉自己本就日益缩小的饭碗。因此，百度的AI搜索，也主要是在搜索结果的首条加入生成式AI。

　　近期百度还推出了聊天模式的AI助手，但只是作为百度搜索的补充，在不破坏基本的商业模式下，有限地尝试。

　　在今年一季度的财报电话会上，李彦宏表示：“大约11%的搜索结果是利用生成式人工智能技术来推算的，但我们目前还没有对这部分生成式人工智能的结果进行商业变现，所以相关营收的对应增长要等一段时间。”

　　AI搜索，不能只用爱发电

　　传统的搜索引擎是台印钞机，商业模式简单却高效，搜索引擎通过关键词，列出一条条网站链接，网站通过用户的点击获得流量收入，搜索引擎通过展示广告赚钱，双方互相成就。

　　但AI搜索打破了这个利益链条。借用Perplexity的官方话术，AI搜索与其说是“搜索引擎”，不如说是“答案引擎”，是“维基百科和ChatGPT生的孩子”，免去了点开链接的烦恼，直接生成答案，把饭喂到用户嘴边。原本站在C位的链接们，只能作为注脚，出现在不起眼的角落里。大部分链接甚至连注脚也挤不进去。

　　答案引擎只给答案，而不是列出链接，相当于把所有的流量截留在自己的界面。用户是方便了，但那些靠搜索引擎流量过活的网站，一下子被断了生路。

　　但AI搜索生成的内容，却恰恰来自被剥夺了流量的网站。你用着我的内容，还夺走了我的流量，这谁受得了。

　　据报道，美国已经有88％的顶尖新闻机构禁止AI爬虫爬取网站内容。美国贴吧Reddit，已经在加强措施限制各类大模型的爬虫爬取自己的公开内容。

　　对于AI搜索，他们也是加倍防范。《福布斯》、《连线》等新闻机构发现，Perplexity在搜索的时候，会偷偷绕过付费墙，抓取只有付费会员才能看到的内容，而且还剽窃记者辛辛苦苦花了几个月写成的文章。

　　Perplexity这种违反了无视网络爬虫排除标准（Robots Exclusion Protocol）的行为，引发了多家媒体机构的不满。《福布斯》已经向Perplexity发函，要求Perplexity删除相关内容，并赔偿福布斯损失的收益。

　　AI搜索打破了网站与搜索引擎之间的互惠互利，但还未建立新的商业模式。

　　AI搜索商业化的艰难，还体现在整个市场的变化上。投资者从OpenAI刚刚推出的兴奋，慢慢回归冷静，甚至开始失去耐心。

　　高盛收集了一波可能因AI而受益的公司股票，组成股票指数，发现自2022年底以来，这些公司的股价并没有跑赢标普500指数。这说明整个投资市场，并没有太看好AI的商业前景。

　　所以，现在AI搜索能否取代还言之过早。事实上，很多业内人士都认为，两者的关系是互补，而非取代。

　　AI搜索更容易满足在特定细分领域的搜索需求，比如知识类的分析与调查。而很多搜索行为，并不只是为了研究“第二次世界大战爆发的原因”，可能只是想通过搜索去另一个网址，或者获得两三句话就能讲清楚的简单信息，不需要附着十几条参考链接的长篇大论，在这些方面，传统引擎显然更合适。

本文地址：http://fhzcwj.xhstdz.com/quote/992.html 物流园资讯网 http://fhzcwj.xhstdz.com/ , 查看更多

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

0 条相关评论

相关最新动态

推荐最新动态

点击排行