关于AI和技术#5
专栏作家
Seong-joong Kang Digital Strategy Team
大家好,不知不觉已经写到了“关于AI和技术”专栏的最后一期。能够以见证着AI洪流发展的专栏作者身份为大家传递信息是一件非常快乐的事情。因此在文章开始之前,我要向赋予我这个身份的Communication Team成员们表达真诚的谢意。
这一期我将为大家解说最近两个月内数以万计的AI消息中“绝不可错过!”的文章(红杉资本的《开启推理时代》),而后听取各位读者反馈的宝贵意见,最后以分享“摘要提示词”作为结尾。
Key Take away
- 推理战争即将开始。推理即代理商、AGI。
- 分享摘要提示词(非唯一标准答案,请酌情参考)。
1 Generative AI’s Act o1 – 代理推理时代来临
最近美国的风险投资公司“红杉资本”在他们的官网上发布了一篇题为《Generative AI's Act o1: The Reasoning Era Begins》的文章。老实说文章有点长,所以这里简单为大家概括几个值得重点关注的点。先说结论,就是“推理时代已经来临。此前在移动通信领域有Tik Tok、Uber、Meta等应用,但这些应用在当前的AI领域存在空白,而填补空白的大概率是代理商。这些代理商将以‘推理’为基础完成这一行为。”之所以先摘出这段话,是因为“推理”的领域已随着GPT 4-o1的问世成为现实。(本期专栏的标题“从生成到推理的时代”是从用户的角度出发命名的,但其实从AI业务角度来说,叫“从学习到推理的时代”可能更为合适。)
来源:《思考,快与慢》,丹尼尔·卡尼曼
在红杉资本的正文中间出现的《思考,快与慢》这本书提到了系统1和系统2的概念。如果能完整看完这本书是最好的,但它足足有727页,想读完并不轻松,这里我们可以简单来了解一下这两个概念。
系统1:依赖直观与过往经验给出快速的、自动的反应。能够有效处理日常工作,但有可能因受限于捷思而产生错误。
系统2:运行慢且慎重,负责逻辑分析与解决问题。用于需要细致的思考和考虑的复杂决策。
一个人想要作出好的判断、正确地活下去,需要妥善地调用系统1和系统2。观察目前为止生成式AI的特点不难发现,它主要基于学习的内容给予回答,如生成图片、翻译、总结、生成视频、读取照片等。用户要求什么,它就生成什么。我个人认为这种机制和系统1类似,因为它依据输入立即完成输出。等到众所周知的GPT-o1发布,“推理”的概念也随之登场。那推理又是什么呢?它接近于系统2,需要判断“思考的快与慢”。这里有几个推理场景,我们来一起测试其中的两种。如果问AI“‘爱茉莉太平洋数字战略单位’的韩语词‘아모레퍼시픽 디지털전략 유닛’中包含几个元音‘ㅣ’?”将得到如下的回答。请大家注意,它“思考了17秒”。
来源:用GPT o1-preview提问示例(笔者亲自提问)
而GPT-4(老模型)被问及同样的问题时,给出的回答是错误的。
再测试一个例子。下面是2024大学修学能力考试(韩国高考)中的一道世界地理题。
>请参考对甲、乙、丙三个国家的正确描述,选出将正确的<表述>集合在一起的选项。
内陆国指的是领土不与海洋相接的国家。欧洲有很多国土面积小的内陆国家,代表性的有梵蒂冈和圣马力诺。这些国家被(甲)包围。位于山地的安道尔也是一个内陆国,与包括(乙)在内的两个国家接壤。还有卢森堡,是被比利时、(乙)和(丙)包围的内陆国。(丙)则与包括卢森堡在内的四个内陆国与其他国家接壤。
<表述>
1. 比利时的瓦隆尼亚(瓦隆)大区主要使用(乙)语。
2. (乙)有洛林工业区,(丙)有鲁尔工业区。
3. (甲)与(丙)接壤。
① 1 ② 3 ③ 1、2 ④ 2、3 ⑤ 1、2、3
正确答案是③。
即使到现在,GPT-4o依旧不失为一款卓越的模型,但它给出的回答是⑤,误将“3. (甲)(即意大利)与(丙)(即德国)接壤”判断为“正确”。
来源:用GPT 4o提问示例,以及错误回答(笔者亲自提问)
这次新发布的GPT 4-o1则“思考”了9秒给出了回答。
来源:用GPT o1-preview提问示例,以及正确回答(笔者亲自提问)
观察AI的推理能力可以发现一个重要的点,那就是我们能够利用这种推理能力“深度思考,创意性解决问题”。红杉资本由此得出结论:“推理战争”即将开始,OpenAI、Anthropic、Google、Meta能在推理领域实现什么有待关注。
红杉资本的文章还提到了我们在上一期专栏谈及的“Service-as-a-Software”,服务即软件,也就是“通过解决有待解决的工作来赚取报酬”(原来的“Software as as Service”方式是将软件作为服务,通过互联网出售)。
“Service-as-a-Software”,也就是出售工作,它的关键点在于“扩大市场”。如果说现有的软件市场规模有650B,那么应用AI后出售工作的服务市场规模可以达到10T。
来源: Generative AI's Act o1: The Reasoning Era Begins | Sequoia Capital
之后红杉资本提出了几个出售这些工作的主体,即代理应用程序的例子。
在文章最后提到的下图右上角的“AI应用”部分将发生不同的变化,我们拭目以待。此外,事实上推理&行动过程也意味着AGI(通用人工智能)的开始。
来源:Generative AI's Act o1: The Reasoning Era Begins | Sequoia Capital
以笔者的观点来解读上图的话,左列(基础设施/安全/数据/软件开发商)可以视作开发层,上方“APPS”部分的中间位置,即“Mobile”部分有我们熟悉的应用程序。正如我们在实际生活中感受到的那样,“移动应用”基于各种基础设施发展并扩大了产业范围,同样地,“AI”领域也将出现一系列新的变化。
接下来笔者将按照某位读者的反馈内容,“分享一些不错的提示词”。
2 摘要提示词分享
本提示词不是唯一标准答案,请根据结果酌情删改。
其实笔者自GPT 3.5发布以来就一直专注于“摘要”,因为笔者无法看完海量信息和每天更新的YouTube内容,遇到把结论放在最后的文章,也很想先看到结论。
另外ChatGPT反复输出“试试(해볼게요)”或者韩语中的叙述型终结词尾(있습니다)也很让人头疼,因此笔者结合这些要求,经过一年的删改编辑出了下面的提示词(不可否认,这些问题可能还有更好的办法去解决)。
如果能够从公司内部使用的提示词中筛选出优秀的并将其转为资产,那再好不过。希望有一天爱茉莉太平洋的成员们注入心血产出的结果能够跳出个人产物的范畴,成为公司的优质资产,并进一步惠及其他成员,孕育出更好的结果。
笔者带着这样的愿望,以及希望读者以“除了这个还有更好的方法”的形式反哺的期待,分享提示词如下,同时以此结束社内专栏作者的活动。
你的任务是根据给定的文本拟写一份明确的、有组织性的报告。
这份报告应识别和说明文本提及的主要主题。
报告字数在2000字左右。
为了提升报告的可读性和组织性,应使用适当的形式,例如使用标题或目录等。
报告应将重点放在文本提及的核心重点和主要想法。
进入报告正文之前,应简单向读者介绍报告的脉络。
之后拟写Key Take away,把最重要的5条内容以项目符号的形式列出。
报告正文按照如下内容拟写:
脉络很重要。应谈论具体;如果出现公司名称,则明示它并加以整理。如果有年月日等信息,应提及年月日并同步整理。应使用学术性词汇,以便让读者获得知识。应使用Markdown。
按照如下示例更改拟写方式:
- 将韩语中“有(있습니다)”的陈述式终结词尾转化为“有(있음)”的名词型转性词尾。
- 将韩语中“预定(예정입니다)”的陈述式终结词尾转化为“预定(예정임)”的名词型转性词尾。
- 将韩语中“适合(적합합니다)”的陈述式终结词尾转化为“适合(적합함)”的名词型转性词尾。
拟写完报告后,根据正文的内容,应在文章末尾横向罗列25个话题标签。
```
(请在这里粘贴需要筛选摘要的文本)
```
参考资料
喜欢
0推荐
0赞赏
0支持
0想看后续
0