OpenAI,为什么没敢推AI搜索_tiknovel-最新最全的nft,web3,AI技术资讯技术社区

OpenAI,为什么没敢推AI搜索

2024-05-13 15:48:56  浏览:262  作者:管理员
OpenAI,为什么没敢推AI搜索

AI 搜索本质是 AI Agent,在垂直场景更有潜力。

本周,OpenAI 搞了一个大花活。

整整一周,不断有外媒获得最新消息,报道 OpenAI 即将推出搜索产品,甚至前几天,已经有媒体拿到了 ChatGPT Search 的提前体验版本——界面仍然是对话交互,但 GPT 回答时会使用网络信息进行回答。

不过,在预热了一整后,5 月 11 日最新消息,OpenAI 在下周将举行发布会,但将不会发布 GPT-5,也不会发布 AI 搜索引擎。

AI 搜索目前是海内外 AI 创业团队的重要方向之一。在海外,主打 AI 搜索的 Perplexity 目前估值已经超过 10 亿美元。

OpenAI 为什么会选择这个时间点做了一波这样的宣传?如果 OpenAI 真的入局搜索,会对搜索格局带来什么影响吗?对于创业者来说,AI 搜索是一个好的方向吗?

5 月 10 日,极客公园创始人&总裁张鹏、推出国内第一款融入大语言模型的搜索引擎-天工 AI 搜索的昆仑万维董事长兼 CEO 方汉,和投资了最近几个月数据飙升的秘塔搜索的猎豹移动董事长兼 CEO 傅盛,在极客公园「今夜科技谈」的直播中,共同聊了聊这个话题。

两位嘉宾都是经验丰富,身经百战的创业者,在外媒传出确切消息之前,就明确指出了 OpenAI 此次传出要推出 AI 搜索引擎的消息,大概率并不是要在此投入巨大的精力,做成一项惊人的产品,而更多的是一场 PR 战术。

两人共同对 AI 搜索背后所需的技术储备、AI 搜索的成本结构和商业模式进行了分析,并对 AI 搜索的未来进行了展望。

极客公园对此次直播进行了整理,分享如下。

01 OpenAI 做搜索,

能做出什么新的花样?

极客公园:OpenAI 为什么在这个时间点上,传出要推出搜索引擎?

傅盛:前天我和朱啸虎一起参加了中投的论坛,他当时有一个观点就是觉得 OpenAI CEO Sam Altman 是一个非常能吹牛的人。我觉得无论怎么说,我们要意识到,Sam Altman 的 PR 能力确实是非常强的。

从历史上来看,他每一次 PR 的时间点都拿捏地非常准确。当时发布 Sora 的时间点,就是 Anthropic 的 Claude3 和其他几个大模型上线的时刻。它们在文本能力上突进地很快,那 Altman 立即给你升维一下,说你看你还在讲陆军的事,我都到空军了,然后立即舆论又都在关注 Sora,OpenAI 又成了业界唯一的明星。

其实你现在回头想想,Sora 从头到尾就是一场 PR,现在都五月了,还是没有开放给公众使用。

传闻中的 OpenAI Search 测试界面 | 图片来源:赛博禅心

我的观点是,GPT-5 的研发,肯定遇到了一些问题。如果不是这样,直接上 GPT-5 就好了。科技企业,永远都是能早一天就早一天,绝对不能晚的。GPT-5 要不就是性能没有提升地那么惊艳,要么就是成本上特别高。

但以我对 OpenAI 的理解,即使成本再高,只要效果特别惊艳,它一定会往外放,先震你一下再说,哪怕 GPT-5 一天就能用 5 条,那也让你先用一下,让所有的人的目光都过来。所以我觉得 GPT-5 的研发可能还是遇到了一些问题,不管是成本,还是所谓安全性问题,或者幻觉问题,反正多少遇到了问题。

作为 OpenAI 来说,现在这么烧钱的情况下,用户量增长就是它的核心命脉,一旦不增长,融资下笔钱的时候,估值上不能再上一个台阶,就会很麻烦。

所以我觉得这次说要做搜索引擎,就是围魏救赵,我最近经常唱衰 OpenAI,因为我觉得,从一个商业公司角度,其实 OpenAI 走到这里,现在有点骑虎难下。

方汉:我首先非常赞同傅盛老师一个观点,就是 Sam Altman 的确是一个 PR 高手,而且是是绝顶高手。

我认为在 OpenAI 里面,权力最大的其实是 PR 团队,或者说负责去融资的团队,其次是技术团队,再其次是产品团队。我认为这个排序导致了 OpenAI 做出了种种行为。

GPT-4.5 和 GPT-5 为什么迟迟不发?根据我得到的消息,OpenAI 已经训出来了,也不是能力不行,但是它现在没有把握在工程上把这个东西效益最大化。

这个的意思是什么?刚才我们也聊到了,用户涨不上去是 OpenAI 现在最头疼的事情。如果发布了一个新的大模型,它没有把握一次性、瞬间获得足够多的用户,那它就不会上,这是它根本性的原因。

那么发搜索产品呢?我们目前看到的产品形态上来讲,OpenAI 的搜索产品,并没有对海内外所有的搜索引擎产品,形成碾压,形成 SOTA(state-of-the-art,最佳表现),发布这个产品,可能会让用户有一点增长,但不会让用户翻倍增长。所以我认为,这是在 Google I/O 前一周对谷歌的一次战略狙击,它的根本战术上,还是在等待和筹备 GPT-4.5。

极客公园:OpenAI如果推出搜索引擎,会解决 OpenAI 的什么问题吗?会使搜索引擎的格局有变化吗?

方汉:我觉得它应该能提升用户使用上的体验,但是对大盘影响不大。

最早 Bing 推出 new Bing 的时候,把谷歌都吓死了,但最后对于 Bing 的大盘其实没有什么影响,谷歌过了半年一看市场份额好像没什么变化。我觉得搜索引擎对于 OpenAI 的用户增长也不会有根本性的变化。

傅盛:我还没看到它的具体页面会是怎么设计,但我觉得如果它变成一个默认功能的话,还是多少会增加一些用户的这个感知点的。未必是能带来多少新用户,但是老用户的留存活跃这件事可能能够变得好一点。

OpenAI Search 测试界面 | 图片来源:赛博禅心

搜索这个功能,对于用户日常将其从好玩,变成当作生产力工具使用,是非常重要的。我其实之前一直不明白为什么 ChatGPT 在发布之初没有增加这个功能,我怀疑,原因可能在于成本。

它本来成本已经很高了,也一直在努力降成本。不加搜索时,本来用户问一个问题,然后模型去预测下一个字,都需要这么多推理成本。

如果加上搜索后,用户问一个问题,你先去啪啪啪搞出几十个网页,抓取下来几千个字,传给模型再让模型总结,那这个成本就高很多了。

极客公园:在部分灰度用户的测评中,我们看到此次 OpenAI 所说的搜索产品,其实产品形态和现有的搜索产品很接近。是不是AI搜索的产品形态,没有太多的创新空间了?

傅盛:现在这个形态的 AI 搜索,我觉得创新空间不大。

AI 搜索,是让用户省去了去点网页、选网页以及看网页的过程,而把这个过程用大模型,用 AI 去替你做这件事情。

这里面涉及两个技术问题,一个是把网页收集回来,一个是把网页内容传递给大模型让大模型进行总结。

前者涉及到要建立网页索引库,而不是简单地去百度搜几个网页,然后拿回来加工——百度肯定是不让你这么干的。秘塔搜索也是自建了索引库。而后者涉及到 AI 算法和模型能力。

我觉得形态上大家都是比较类似的,而从模型能力角度讲,目前看来,整理网页内容把它输出出来,需要的AI能力,其实也不是那么高,百亿参数的模型已经够了,那后面就是涉及到,谁能把工程化、产品化做的更好。

工程化是什么意思?

技术,我们指的是算法啊等等的进步。比如原来是用牛、马来进行运输,那我现在在算法层面,做出一个超级算法,相当于我做了一个蒸汽机,把这些东西统统搞定,仍然能保证有很强的运载力。

而工程化,指的是,有时候现在没有这么强的一个技术出来,我们怎么去多搞牛、马,协调这一千头牛、一万匹马,来完成一件事,保证它不出错。

AI 搜索,现在虽然是大一统了,在很多细微的地方,就能看到不同的产品,是不一样的。

PerplexityAI 的搜索界面 | 图片来源:截图

比如用户在问不同问题的时候,看似在做同一件事,其实不同的搜索产品背后,会用不同的分类策略,对问题先进行分类。哪些问题深度要求高,哪些问题实时性要求高,再做对应处理,不同的产品就会体现出区别。

再比如一个回答,是从知识库里调出来只是进行回答,还是纯网页的信息整合?那天我问秘塔搜索,第三次世界大战会不会打起来?你会发现它的回答,不完全是忠于网页内容做出来的报告,它给了我三种可能:打、不打、说不清楚。但是同时它搜了很多网页,为选项做了支撑。这个如何保持一定的客观性,分配权重,是很细的活。

再比如,AI 搜索引擎怎么去做排序?这也是一个点,而且可能未来和传统搜索引擎的点完全不一样。比如传统搜索引擎,一般不会把一篇很专业的,非常长的论文,直接推到用户面前。但是在 AI 搜索下,为了提供更准确的回答,它在搜索引擎所依赖的背后内容的排序上,可能反而是很靠前的。

所以我觉得,未来AI搜索产品,拼的应该不是谁的技术特别牛,拼的是如何让搜索结果能够更忠于网页内容,如何做出更体系化的整理这种工程能力和产品设计能力。

方汉:我认为现在的 AI 搜索的产品形态只是一个暂时的一个形式,为了让传统搜索引擎用户,能够很顺畅地迁移到新形态的 AI 搜索上去。但是随着技术和产品的迭代,我相信新的交互形式、新的产品形式都会在 AI 搜索上展现。

比如我们可以看到这次 OpenAI 的搜索 GPT,里面含了一个功能叫 wikis,我认为可能就是用 GPTs 这种 agent(智能体)来实现的。在搜索的时候,可以调用各种各样的模型解决用户的问题,将是AI搜索的上限所在。

也就是说,根据用户的特定需求,我可以调用各种各样的模型,我可以调用翻译模型,我可以调用总结模型,我还可以调用 tts 模型,把它转成语音输送给你。如果用户想在论文方向搜索,我专门做一个论文的智能体,调用这个智能体来回答你的问题,这个上限我觉得是非常高的。

在我们的实践过程中,我们的天工 AI 搜索里面已经集成了大量的官方的制作的智能体来提升 AI 搜索的效果,且推理成本其实还是可控的。

但是我这里要吐槽一下 OpenAI。因为我看了 OpenAI 的使用界面之后,我心里的想法是,他们的技术话语权远远超过产品的话语权。

为什么这么说?

它们的产品里,要搜索,首先要选模型,两到三个模型,还要选是否使用图像搜索等等,我觉得复杂度比谷歌还高。我一个做技术的人,我看没有问题,但很多用户一定是用不明白的。他们的所有技术细节都没有藏起来,我开个玩笑,这样做产品的,在张小龙手下,一定活不到第二天。

所以总的来说,我认为 AI 搜索的形态仍然有非常大的进化空间,但具体怎么变,说实话我也很难预测。

OpenAI 也没有带来太多产品形态方面的惊喜,最多就是这个 GPTs,但我觉得在国内的人看来,比起我们熟悉的微信小程序什么的,看起来也还是挺落后的。

02 AI 搜索好在哪?

从设计原理上解决幻觉问题

极客公园:AI 搜索相对于传统搜索引擎有哪些区别,有哪些优势?

方汉:传统的搜索引擎是通过爬虫,把互联网上所有的网页都抓取回来,然后经过清洗跟排序,最后在用户打出查询词的时候,搜索引擎按照自己的逻辑,对网页进行排序,给到用户。整个过程,用户需要自己选点那个网页,点开之后也要自主去看。

而 AI 搜索,让用户省去了去点网页、选网页以及看网页的过程,你直接看到的,就是它对现有网页的一个总结结果,相当于一个搜索小秘书。

它最大的作用是什么呢?是降低了用户的搜索时间,以及提高准确性。

我们都使用过传统搜索引擎。要去打开网页看内容,看完了靠人脑去总结,耗时其实是蛮长的,基本上都要几分钟,但现在大模型替你做这个事情,它可以在几秒钟之内就可以给你一个总结,基本上天工搜索的用户基本上都会反映它极大地提高了大家的工作效率,甚至它一些总结,包括脑图 PPT 你可以直接用。

天工 AI 搜索的增强模式(共有简洁、增强、研究三个模式)| 图片来源:截图

在传统搜索引擎中,最早谷歌搜索引擎除了搜索按钮以外,还有另外一个按钮 I feel lucky,点一下就直接进入第一个搜索结果,实际上是传统搜索引擎降低交付的走成本的一个尝试。本质上我们现在所有的 AI 搜索就是 I feel lucky 那个按钮所起到的作用,只不过我们做的比他们要好得多。

另外就是准确性。AI 搜索解决了大模型的幻觉问题。大家一开始用 ChatGPT,其实很多人是把它当搜索引擎用的,但实际上它是会经常一本正经的胡说八道。AI 搜索通过 RAG 这些技术,先找到事实,12345,限制大模型根据以上事实来回答问题,能极大地抑制甚至彻底消除大模型的幻觉。

傅盛:我们一定要意识到一点,就是搜索用户在搜索的时候,其实抱着非常多的目的。有的搜索,就是寻址,我懒得记一个网页的网址,我要去那个网页,我就去搜索引擎上搜索一下。不知道大家知不知道,以前百度搜索的第一名,是 Hao123,是一个汇集其他网址的导航网站。

还有一些搜索,只需要一些及时的简单内容,这种也不太需要 AI 搜索。我觉得现在的 AI 搜索,更侧重于一些特定的搜索需求——在一个相对复杂的问题下,对网络上的结果进行综合分析,更偏向于形成某个东西的一份调查报告那种感觉。

秘塔搜索的研究模式(共有简洁、深入和研究三个模式)|图片来源:截图

当然它从客观上克服了幻觉的问题,但理解 AI 搜索,一个更好的理解是把它理解为个大模型的一个非常垂类的场景,大模型作为主力,去帮我研究一下比如新能源车最近价格是如何变化的,这个助理就帮你去在搜索引擎上找了一堆的文章,然后给你整理了一份报告。

极客公园:用户愿意信任 AI 搜索吗?AI 搜索是不是只是一小波用户的需求,而不是一个大众需求?

傅盛:用户愿不愿意信任 AI 搜索,AI 产品能做出怎样的体验非常非常关键。

比如秘塔搜索,在产品中,它生成的回答,会列出参考的资料,12345,列给你看,增强你的信任感。我看到有些竞品,也列了 12345,但实际上,引用的不是列出来的最新内容。

秘塔搜索的深入模式(共有简洁、深入和研究三个模式)|图片来源:截图

所以我觉得,用户的信任,可能是需要通过不断地通过品牌的行为,去强化和获得的。

不产生幻觉,我觉得技术上是完全可以做到的。这时候就要看,是不是因为大家做产品做的比较快,细节上做的不够,另外任何搜索引擎,包括传统搜索引擎,也会出现一些误差,能不能把这个比率控制在不影响体验的范围内。

这也是我前面说,AI 搜索现在是比拼工程化、产品化的时候的原因。不是弄一堆文章过来,整理一下,就算做好了。

对 AI 搜索引擎来说,其实用户对于 AI 不信任的问题,反而是其次的。更多的是,如何去用 AI,满足更多的搜索需求。

比如百分之八九十的搜索,可能不需要用到深度分析,我在传统搜索引擎下,搜一下得到一个电话或者地址就好了。这可能是 AI 搜索需要解决的更大的问题。

不过长期来说,所有的搜索,肯定都是 AI 搜索。包括传统的搜索引擎,他们也在看,也在推出 AI 搜索的功能,大家最后肯定是殊途同归的。

方汉:我认为 AI 搜索首先是没有幻觉问题的,因为从技术原理上来说,它是先搜索再总结,然后再通过智能体去处理。在这个流程过程中,我们从源头杜绝了这个欺诈的问题。

同时传统搜索引擎,要列出更多网页,需要保证这所有网页都不是欺诈网页。而我们只需要把这些网页里面我们认为最可靠的三个,互相交叉验证之后最可靠的三个的内容进行总结,展现在网页上给用户去看,那么一定是可靠性是增强了的。

我们都有能力鉴别一个网页是不是欺诈,但并不是所有用户都这样。我们的父母辈,他们真的是没有能力鉴别这一点的。天工搜索有合规小模型,反欺诈模型来筛选网页,也会从 prompt 端优化让模型输出多数网页认可的价值,那鉴别能力低的用户用 AI 搜索,效果一定是正向的。

我们这些很熟悉技术的人,自己很熟悉传统搜索,能够主动地去合适的网站找到合适的内容,所以有时候觉得一部分需求好像 AI 搜索满足不了。但我们不要忘记,AI 搜索从出现到现在也就一年多的时间,随着时间的推移,我认为 AI 搜索在体验、准确性等问题上都会远远超过搜索引擎,

我们的用户数据里看到,天工搜索的用户的粘度是非常高的,非常信任我们。为什么?因为他们会看我们给出的索引。

比如说体制内的人用我们的搜索帮助写公文,他会发现我们索引,引用的都是官方媒体的,他用了几次之后就会非常信任我们,所以我认为,信任会随着时间的推移而逐渐增强。

天工 AI 搜索的研究模式(共有简洁、深入和研究三个模式)|图片来源:截图

至于用户群体,我刚才也提一下,new Bing 出现后,Bing 搜索引擎的市场份额只有小幅增加。那是因为它当时的智能体的技术不成熟。

用户上来就是搜一首歌、搜个电视剧、看个八卦什么的,我认为这部分需求用智能体一定是可以解决得非常好的。

有了智能体的技术,用户更多的长尾需求可以得到满足,那么我认为用户量的增长是指日可待的。

我完整的经历了中国搜索引擎的发展过程。当初百度搜索在那个北大燕园资源楼办公的时候,我还去参观过。其实最早用搜索引擎的人,也全是像我们这样的一些技术极客,但慢慢的它就会泛化到全人群。我认为 AI 搜索也是这样。

现在使用我们 AI 搜索的主要用户应该还是白领用户以及技术极客居多。随着时间推移,AI 搜索也一定会逐渐被更多样的人群使用。

03 AI 搜索的商业前景:

成本低于 5 美分就能盈利

极客公园:传统的搜索引擎,用户免费使用而 B 端投放广告,形成了成熟的商业模式。AI 搜索中,用户直接得到搜索结果,会不会改变商业模式?能够盈利吗?

方汉:上个时代的搜索成本,它首先有个固定开销,就是你的爬虫集群的开销,这个爬虫集群,如果索引全球的网页的话,那基本上在 3, 000 台服务器到 1 万台服务器之间,这是个固定开销。

另外一部分成本就是做 page rank(网页排

评论区

共 0 条评论
  • 这篇文章还没有收到评论,赶紧来抢沙发吧~

【随机内容】

返回顶部