摘要:进入人工智能反乌托邦仅三年,我们就开始看到企业在我们预期的某些领域创造价值—但不是全部。 Tomasz 认为,人工智能的现状可以归纳为三类。
据业内专家称,2024 年注定是生成式人工智能的辉煌一年。运营用例浮出水面,技术正在降低进入门槛,通用人工智能显然指日可待。
那么……这些都发生了吗?
嗯,有点。在 2024 年底,其中一些预测已经非常热门。其余的则需要更多的时间进行检验(我正在看通用人工智能)。
以下是领先的未来学家和投资者 Tomasz Tunguz 对 2024 年底数据和人工智能的看法—以及我自己的一些预测。
2025 年数据工程趋势即将到来。
进入人工智能反乌托邦仅三年,我们就开始看到企业在我们预期的某些领域创造价值—但不是全部。 Tomasz 认为,人工智能的现状可以归纳为三类。
预测:可以完成句子、纠正代码错误等的人工智能副驾驶搜索:利用数据语料库回答问题的工具推理:可以完成复杂任务的多步骤工作流程虽然AI副驾驶和搜索在企业组织中取得了一定的成功(尤其是前者),但推理模型似乎仍然落后。据 Tomasz 称,这有一个明显的原因。
模型准确性。
正如 Tomasz 所解释的那样,除非当前模型之前多次看到过某种特定模式,否则它们很难有效地将任务分解为步骤。而这些模型可能被要求执行的大部分工作并非如此。
“今天……如果要求大型模型制作 FP&A 图表,它可以做到。但如果存在一些有意义的差异—例如,我们从软件计费转向基于使用量的计费—它就会消失。”
因此,目前看来,它的 AI 副驾驶和部分准确的搜索结果会获胜。
新工具的好坏取决于支持它的流程。
随着“现代数据栈”多年来不断发展,数据团队有时会发现自己处于一种永无止境的状态。他们会过于关注平台的内容,而没有充分关注(可以说更重要的)如何。
但随着企业格局越来越接近可用于生产的 AI—弄清楚如何操作所有这些新工具变得越来越紧迫。
让我们暂时考虑数据质量的例子。随着数据馈送 AI 在 2024 年成为焦点,数据质量也成为人们关注的焦点。面对真正可能实现的 AI 投产,企业数据领导者没有时间从数据质量菜单中抽样 — 这里进行一些 dbt 测试,那里进行一些单点解决方案。他们现在要承担提供价值的责任,他们需要可以立即有效引入和部署的可信解决方案。
现实情况是,你可以拥有市场上最复杂的数据质量平台 — 最先进的自动化、最好的副驾驶、最闪亮的集成 — 但如果无法让你的组织快速启动和运行,那么你真正拥有的只是预算中的一项和桌面上的一个新选项卡。
在接下来的 12 个月里,我预计数据团队将倾向于使用经过验证的端到端解决方案,而不是拼凑的工具包,以便优先解决更关键的挑战,例如数据质量所有权、事件管理和长期域支持。
而能够满足这些优先事项的解决方案才是 AI 领域最终获胜的解决方案。
与任何数据产品一样,GenAI 的价值来自两种形式之一:降低成本或创造收入。
在收入方面,你可能会拥有 AI SDRS、丰富机器或建议之类的东西。根据 Tomasz 的说法,这些工具可以产生大量的销售渠道……但这不会是一个健康的渠道。因此,如果它不能创造收入,AI 就需要削减成本——在这方面,这项新兴技术肯定找到了一些立足点。
“没有多少公司会停止与 AI 的业务往来。这主要是降低成本。Klarna 裁掉了三分之二的员工。 Microsoft 和 ServiceNow 的工程生产率提高了 50-75%。”
Tomasz 表示,如果满足以下三个标准之一,AI 用例将带来降低成本的机会:
重复性工作充满挑战的劳动力市场紧急的招聘需求Tomasz 引用的一个例子是有效推动新收入的组织 EvenUp——一家自动处理催款信的交易法律公司。像 EvenUp 这样支持模板化但高度专业化服务的企业可能处于独特的位置,能够看到当前形式的 AI 的巨大影响。
与一年前人们所接受的“AI 战略”海啸相比,今天的领导者似乎一致向这项技术退了一步。
“去年有一波浪潮,人们尝试各种软件只是为了看看它。他们的董事会在询问他们的 AI 战略。但现在,早期浪潮中出现了大量流失。”
虽然一些组织只是没有从早期的实验中看到价值,但其他组织却在其底层技术的快速发展中苦苦挣扎。据 Tomasz 称,这是投资 AI 公司面临的最大挑战之一。并不是说这项技术在理论上没有价值—而是组织还没有弄清楚如何在实践中有效地利用它。
Tomasz 认为,下一波采用浪潮将不同于第一波,因为领导者将更清楚自己需要什么以及在哪里可以找到它。
就像大型演出前的彩排一样,团队知道他们在寻找什么,他们已经解决了法律和采购方面的一些问题——尤其是数据丢失和预防—并且他们准备好在合适的机会出现时采取行动。
明天的重大挑战是什么?“我如何才能更快地找到并出售价值?”
开源与托管之争是一个古老的故事……嗯,有些古老了。但当涉及到人工智能时,这个问题就变得复杂得多。
在企业层面,这不仅仅是控制或互操作性的问题—尽管这肯定会发挥作用——这是一个运营成本的问题。
虽然 Tomasz 认为最大的 B2C 公司将使用现成的模型,但他预计 B2B 将倾向于使用自己的专有和开源模型。
“在 B2B 中,你会看到整体上较小的模型,以及整体上更多的开源模型。这是因为运行小型开源模型要便宜得多。”
但这并不全是金钱问题。小型模型也能提高性能。与谷歌一样,大型模型旨在服务于各种用例。用户可以有效地向大型模型询问任何事情,因此该模型需要在足够大的数据语料库上进行训练才能提供相关的响应。
不幸的是,模型训练的主题越多,它就越有可能混淆多个概念—随着时间的推移,输出的错误率就会越大。
Tomasz 说:“你可以使用 llama 2 之类的具有 80 亿个参数的模型,通过 10,000 张支持票对其进行微调,它的性能会好得多。”
此外,ChatGPT 和其他托管解决方案经常在法庭上受到质疑,原因是有人声称它们的创建者对这些模型所训练的数据没有合法权利。
在许多情况下,这可能并没有错。
除了成本和性能之外,这可能会对专有模型的长期采用产生影响—特别是在受到严格监管的行业—但这种影响的严重程度仍不确定。
当然,专有模型也不会就此罢休。如果 Sam Altman 对此有任何看法的话,就不会。如果 Twitter 教会了我们什么,Sam Altman 肯定有很多话要说。
专有模型已经在积极降价以推动需求。像 ChatGPT 这样的模型已经将价格降低了约 50%,并预计在未来 6 个月内再降价 50%。对于希望在 AI 军备竞赛中竞争的 B2C 公司来说,这种成本削减可能是一个急需的福音。
在扩大管道生产规模方面,数据团队通常会遇到两个挑战:缺乏足够技术经验的分析师和缺乏足够时间的数据工程师。
这听起来像是 AI 的问题。
当我们展望数据团队的发展方向时,我认为有两个主要发展可能会在 2025 年推动工程和分析职责的整合:
需求增加—随着企业领导者对数据和 AI 产品的需求不断增长,数据团队将不得不用更少的资源做更多的事情。为了尽量减少瓶颈,领导者自然会授权以前专门的团队承担更多对其管道及其利益相关者的责任。自动化方面的改进—新需求总是推动新创新。 在这种情况下,这意味着人工智能支持的管道。随着技术自然变得更加自动化,工程师将能够用更少的资源做更多的事情,而分析师将能够自己做更多的事情。这个论点很简单—随着需求的增加,管道自动化将自然发展以满足需求。随着管道自动化的发展,为了满足需求,创建和管理这些管道的障碍将会减少。技能差距将会缩小,增加新价值的能力将会提高。
向自助式AI管道管理的转变意味着每个人工作中最痛苦的部分都会被自动化—而他们创造和展示新价值的能力也会在此过程中得到扩展。听起来是个美好的未来。
你可能见过一条蛇吃自己尾巴的图像。如果你仔细观察,你会发现它与当代人工智能有着惊人的相似之处。
目前互联网上大约有 21-25 万亿个 token(单词)。当今生产中的人工智能模型已经使用了所有这些词。为了使数据继续发展,它需要一个无限大的数据语料库来进行训练。它拥有的数据越多,它可用于输出的上下文就越多—这些输出就越准确。
那么,当AI研究人员用完训练数据时他们会怎么做呢?
他们自己制作。
随着训练数据变得越来越稀缺,OpenAI 等公司认为合成数据将成为未来训练模型的重要组成部分。在过去的 24 个月里,整个行业都在为这一愿景而发展—包括像 Tonic 这样生成合成结构化数据的公司和 Gretel 这样的为金融和医疗保健等受监管行业创建合规数据的公司。
但合成数据是一个长期的解决方案吗?可能不是。
合成数据的工作原理是利用模型创建人工数据集,这些数据集反映了人们可能自然发现的内容(在某个实际存在更多数据的替代现实中),然后使用这些新数据来训练他们自己的模型。从小规模来看,这实际上很有道理。你知道他们怎么说好东西太多了……
你可以把它想象成情境营养不良。就像食物一样,如果新鲜的有机数据源是模型训练最有营养的数据,那么从现有数据集中提取的数据本质上就必须比之前的数据营养丰富程度更低。
加一点人工调味料是可以的—但如果这种合成训练数据的饮食持续下去,而不引入新的草饲数据,该模型最终将失败(或者至少,指甲床会明显不那么美观)。
这实际上不是是否的问题,而是何时的问题。
据 Tomasz 说,我们目前距离模型崩溃还很远。但随着AI研究继续将模型推向其功能极限,不难看出人工智能达到其功能平台的世界—也许很快就会出现。
在生产中利用非结构化数据的想法并不新鲜——但在AI时代,非结构化数据已经承担了全新的角色。
根据 IDC 的一份报告,目前只有大约一半的组织非结构化数据正在被分析。
所有这一切都将改变。
就生成式AI而言,企业的成功在很大程度上取决于用于训练、微调和增强它的大量非结构化数据。随着越来越多的组织希望将人工智能应用于企业用例,对非结构化数据以及蓬勃发展的“非结构化数据栈”的热情也将继续增长。
一些团队甚至在探索如何使用额外的 LLM 为非结构化数据添加结构,以扩展其在其他培训和分析用例中的实用性。
确定组织中存在哪些非结构化第一方数据——以及如何为利益相关者激活这些数据——对于希望展示其数据平台的商业价值(并希望在此过程中获得一些额外预算用于优先计划)的数据领导者来说,这是一个全新的机会。
如果 2024 年是关于探索非结构化数据的潜力——那么 2025 年将是关于实现其价值。问题是……哪些工具会浮出水面?
如果你最近在风险投资领域附近游泳,可能会经常听到几个术语:“副驾驶”是指用于完成单个步骤(“纠正我糟糕的代码”)的人工智能的花哨术语,以及“代理”是指可以收集信息并使用它来执行任务(“写一篇关于我糟糕的代码的博客并将其发布到我的 WordPress”)。
毫无疑问,我们已经看到 2024 年AI副驾驶取得了很多成功(只需询问 Github、Snowflake、Microsoft 回形针等),但AI代理呢?
虽然“代理式AI”在对客户支持团队造成严重破坏方面玩得很开心,但看起来这在短期内注定会如此。虽然这些早期的AI代理是向前迈出的重要一步,但这些工作流程的准确性仍然很差。
就上下文而言,最先进的AI的准确率为 75%-90%。大多数 AI 相当于一名高中生。但是,如果你有三个步骤的准确率达到 75-90%,那么最终的准确率约为 50%。
我们已经训练大象以比这更高的准确率进行绘画。
大多数 AI 代理远非组织的收入驱动因素,如果以目前的性能投入生产,它们将会产生积极危害。根据 Tomasz 的说法,我们需要首先解决这个问题。
能够谈论它们很重要,除了演示之外,没有人取得过任何成功。因为无论硅谷的人们多么喜欢谈论 AI 代理,这种谈论都不会转化为性能。
“在与一群 AI 负责人共进晚餐时,我问有多少人对输出的质量感到满意,没有人举手。获得一致的输出确实是一个质量挑战。”
每年,蒙特卡洛都会调查真正的数据专业人员的数据质量状况。今年,我们将目光投向了人工智能的阴影,信息很明确。
数据质量风险在不断演变——但数据质量管理却没有。
“我们看到团队大规模构建矢量数据库或嵌入模型。大规模 SQLLite。所有这些 1 亿个小型数据库。它们开始在 CDN 层进行架构设计,以运行所有这些小型模型。iPhone 将拥有机器学习模型。我们将看到管道总数激增,但数据量却要小得多。”
微调模式将导致组织内数据管道数量激增。但管道扩展得越多,数据质量就越困难。
数据质量与管道的数量和复杂性成正比。管道越多(它们变得越复杂),发生故障的机会就越多—而且你及时发现它们的可能性就越小。
来源:信息趣话坊