Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

ChatGPT神器Code Interpreter终于开放,到底怎么用?这里有一份保姆级教程

两天前,OpenAI 宣布要在一周之内将官方插件 Code Interpreter 通过设置中的 Beta 面板向所有 ChatGPT Plus 用户提供。

这个消息让很多人激动了起来,毕竟此前 Code Interpreter 一直处于封闭测试阶段,只有一小部分用户真正使用过。这些内测用户用它来数据分析、创建图表、编辑文件、执行数学运算等,反响普遍不错。

大家没有等太久,今天,Code Interpreter 已经正式开放。

图片

不过对于很多用户来说,如何让 Code Interpreter 物尽其用,还得好好研究一番。

以下是一些内测用户晒出的示例,为大家提供一些参考。

「博士期间几周才学会的东西,AI 几秒就完成了」

宾夕法尼亚大学沃顿商学院的教授 Ethan Mollick,是一位拥有数月 Code Interpreter Alpha 版本试用经验的 ChatGPT Plus 用户。他对 Code Interpreter 的评价还是比较高的,称之为「用过的最有用、最有趣的 AI 模式」。

Ethan Mollick 明确表达了两点感想:1)Code Interpreter 工作得非常好,不像插件那样完全是偶然的;2) 提示制作通常是没有必要的,用户只需与 AI 讨论代码或数据以及想要什么就可以了。

「Code Interpreter 延续了 OpenAI 长期以来给东西起可怕名字的传统,因为这对那些根本不懂编程的人来说可能最有用。它允许现有的最先进的 AI GPT-4 上传和下载信息,并在一个连续的工作空间为你编写和执行程序。这使得 AI 可以做各种以前不能做的事情,并在曾经 ChatGPT 不可能做到的方方面面发挥作用。」

图片

为了帮助大家快速上手,Ethan Mollick 教授撰写了一篇指南,传授了自己使用 Code Interpreter 的经验与心得。

我在读博士时花了几周时间才掌握的东西,AI 在几秒钟内就完成了,而且通常比我预期的人类分析员的错误要少。但对我来说,同样清楚的是,人类不会被 Code Interpreter 所取代。相反,AI 做的是我们一直希望自动化能做的事情 —— 把我们从工作中最恼人、重复的部分中解放出来,这样我们就可以专注于关键的事情。通过简化分析过程,我可以做更多、更深入、更满意的工作。我的时间变得更有价值,而不是更少,因为我可以专注于重要的事情,而不是死记硬背。

Code Interpreter 补上了 ChatGPT 哪些短板?

具体来说,Code Interpreter 为 AI 提供了一个解决问题的通用工具箱(通过用 Python 写代码),一个可以使用的大内存(能够上传高达 100MB 的文件,而且这些文件可以是压缩形式),并以发挥大型语言模型优势的方式将该工具箱整合到人工智能中。

这解决了以前版本的 ChatGPT 存在的一些问题:

1、Code Interpreter 允许 AI 做数学题(非常复杂的数学题)和做更精确的文字工作(比如实际计算段落中的字数),因为它可以编写 Python 代码来解决大语言模型在数学和语言方面的固有弱点。而且它真的很善于使用这个工具,如下所示:

图片

同样的 prompt,Code Interpreter 的字数统计结果是 104 个词。

2、 Code Interpreter 降低了幻觉和迷惑的概率。当 AI 直接与 Python 代码一起工作时,代码有助于让 AI 保持「诚实」,因为如果代码不正确,Python 会产生错误;而且由于代码操作的是数据,不是 LLM 本身,所以没有错误被 AI 插入到数据中。当然这也不完美,AI 仍然会产生幻觉(它似乎经常认为自己能看到它能生成的图形,而这种模式的 ChatGPT 不会),但这些错误不太常见,而且不太可能影响代码或数据本身。

3、Code Interpreter 让人工智能的用途更加广泛。很多问题都可以用代码来解决,GPT-4 非常善于找出何时以新颖有趣的方式使用 Code Interpreter。例如,用户要求它用代码向一个怀疑者证明地球是圆的,Code Interpreter 会提供多个论据,将文本与代码、图像结合起来。

图片

4、用户不必编程,因为 Code Interpreter 可以代替做所有的工作。之前的很多 LLM 都能写代码,但你必须自己运行和调试。对于以前从未真正使用过 Python 的人来说,这很难,而且要和 AI 来回纠正错误。现在,AI 会纠正它自己的错误并给到你输出。

5、它给了你更多的 AI Moment。任何使用过 GPT-4 的人都可能遇到过至少几个时刻,感觉就像机器里确实有一个幽灵。实际上大家也知道这是一种幻觉,而且 LLM 根本就没有知觉或思维,但这些时刻是对更智能的 AI 的未来的一瞥,有时令人激动,有时令人不安。Code Interpreter 提供了相当多「很奇怪」的时刻。

比如 Ethan Mollick 曾要求 AI「用代码调用各种情绪状态」或者「给我看一些不可能用代码做的事情,并演示一下」。这里可以看到「使用你可用的绘画工具,通过创建一个图像,创造一个全新的备忘录。让它与你作为 AI 与人类合作的经验相关」的结果:

图片

如何使用 Code Interpreter 处理数据

Code Interpreter 是一个令人印象深刻的「数据科学家」,能够将定量分析的许多复杂事物自动化,并且能够对数据采用非常复杂的方法。为了说明这一点,Ethan Mollick 从一个有趣的数据集「Super Heroes」开始。

上传数据很容易,即使是像 ZIP 文件这样的压缩数据,只要点击加号按钮就可以了:

图片

你应该在数据中加入一个初始提示,但它可以是相当少的,Ethan Mollick 用的 prompt 是这里有一些关于超级英雄力量的数据,翻看一下,告诉我你发现了什么」,然后得到了不错的结果。如果你有一个数据字典,也可以直接粘贴进去。AI 很善于仅从上下文中找出数据的含义和结构。

可以注意到,Code Interpreter 与其说是提示制作,不如说是与 AI 进行对话,把它当作一个分析师和它交谈。

图片

事实上,也有两个例外情况,其中提示的制作似乎很重要:首先,AI 有时会忘记它能做的事情(如制作 GIF 或 3D 图),你可能需要鼓励它(「你能制作 GIF,请试试」);其次,你会希望 AI 在自己的工作上有所改进。只要求它对这个结果做进一步的测试」或「使这个图更漂亮」,一般来说这样就可以了。

目前,数据已经加载完毕了,可以让 GPT 做数据分析工作中最糟糕的部分了:数据合并和清理。

Code Interpreter 将以一种「相当复杂」的方式自动处理这一切,但直接询问通常会有帮助,就好像你在指导一个人类数据分析师一样。你还会注意到,该系统的工作方式是无情的,在发现错误时就会纠正自己的错误。例如,它注意到列的名称有误,并修正了这个问题。

图片

不过这也说明,建议用户仔细检查结果和过程,而不是盲目地相信 AI。

接下来开始进行分析,AI 似乎对分析方法很了解。提示是「我对做一些预测性建模感兴趣,比如根据其他因素预测一个英雄可能拥有的力量。我们应该如何处理这个问题?」

然后 Code Interpreter 构建了一个随机森林!不过也可以看到为什么有专家的人为监督是很重要的,因为作者不同意它通过使用数值化数据的平均值来计算缺失数据的决定。如果是作者自己,会放弃这些数据,但好在可以要求 AI 改变其方法,或讨论其他的选择。

图片

AI 能够进行许多其他分析(毕竟它只是在写 Python 代码),但它选择有意义的分析方法的能力常常给人留下深刻印象。例如,这里有一个关于超能力的网络分析,提示是「你能不能进行另一个真正复杂和有趣的分析」:

图片

但 Code Interpreter 最令人印象深刻的一点是,它以非常人性化的方式对数据进行「推理」。当被问及网络分析的结果时,得出了有趣的结论:英雄通常拥有的一组能力本质上是视觉的(因为它们来自漫画书),适合某些原型,并且最适合构建持续的冒险。

图片

这种互动性能力在可视化阶段仍然有效,你可以与 AI 来回沟通,要求改进和改变。例如,提示「创建一个互动的仪表板,至少有 6 个有洞察力的图表,包括一个 3D 的图表。让仪表板变得漂亮。」

Code Interpreter 先是产生了一个仪表盘,但不太符合作者想要的,所以他直接说「让这个更好,包括更多的名字」等等。然后 Code Interpreter 给出了一个可下载的交互式仪表盘文件,只要把它放在网络浏览器中就可以了 —— 可下载的输出也是 Code Interpreter 的另一个妙用方法。

图片

20个奇妙用例

数据分析之外,Code Interpreter 还有很多妙用。在推特上,一位名叫「Chase Lean」的网友收集了 20 个用例,让我们也来学习一下有什么新玩法:

1、从图像生成视频

首先,上传想要制作动画的图像:

图片

然后要求 AI 从左到右为这张食物图像制作动画。通过修改提示,可以创建自己的动画。点击回车,30 秒即可获得视频:

图片

图片


想让图像变小,就告诉 GPT 将其大小调整为 50%;想让视频从下往上平移,将提示改为「 Start: Bottom → Center → Top: End」;想让视频的速度提高 2 倍,将帧的步长从 8 像素改为 16 像素。

图片

2、从图像摘取文字

图片

3、智能地理解、分析和解释数据

图片

4、用现实物理模拟硬科幻

初始 prompt:「我们将扮演一个科幻场景。我将成为队长。问题是:你必须使场景中的每个挑战都包含你将用代码模拟的真实物理效果。」

图片

5、从图像中提取调色板

Code Interpreter 能从图像中提取颜色以创建调色板.png,并在内存耗尽时自动压缩大型图像:


6、生成二维码

图片

7、将动图转为视频

使用 Code Interpreter,可以在 ChatGPT 中将上传的 GIF 转换成更长的 MP4 视频并慢速缩放。

图片

图片

图片

8、分析期权数据以确定最佳合约

用 Code Interpreter 来分析 7 月 21 日到期的 AAPL 的期权:

首先,在设置中启用 Code Interpreter;然后,上传数据文件。在这个例子中,数据是一个 CSV 文件:

图片

图片

9、分析音乐偏好

使用 Code Interpreter 分析 300 小时的 Spotify 收藏夹播放列表,从 Spotify API 中导出,并运行多维 PCA 和 t-SNE 分析,总结音乐品味。

图片

图片

10、对房地产数据进行数据分析

图片

11、生成并绘制随机数据

图片

12、生成矩阵雨的 GIF 动画

图片

图片

13、清理数据、数据分析和可视化

使用 Code Interpreter,你只需要上传数据,提供简单的英文指示,就可以完成清理数据、在 autopilot 上生成可视化图表的所有工作。

图片

14、创建灯塔位置图

上传美国每个灯塔位置的 CSV 文件之后,Code Interpreter 可以创建这些灯塔位置的 GIF 地图,虽然地图非常暗,但每个灯塔都在闪烁。

图片

15、将数据转换为网页

提供一个未经加工的 UFO 目击事件的数据集,Code Interpreter 就能生成了一个功能齐全的 HTML 热图。下面是一个静态版本(它还可以很容易地创建任意多的版本):

图片

16、使用 Python 复制 STATA 代码

Code Interpreter 能够利用旧的 STATA 文件和代码,用 Python 复制它们:「这里有一个 stata do 文件和一个 dta 文件。复制分析。」、「现在用 CSV 文件给我。

图片

17、下载并分析比特币数据集

Prompt:「Seasonally decompose the price since 2011」

图片

18、犯罪数据趋势可视化

图片

19、生成基因共表达的热图

图片

20、分析泰坦尼克号数据集

上传泰坦尼克号数据集,要求 Code Interpreter 进行一个完整的数据探索性分析。输出结果包括:

1、数据的简要概述;

2、乘客类别的分布图;

3、各组的存活率图;

4、相关矩阵图;

5、数据洞察。


工程OpenAI
3
相关数据
数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

比特币技术

比特币是一种用去中心化、全球通用、不需第三方机构或个人,基于区块链作为支付技术的电子加密货币。比特币由中本聪于2009年1月3日,基于无国界的对等网络,用共识主动性开源软件发明创立。比特币也是目前知名度与市场总值最高的加密货币。 任何人皆可参与比特币活动,可以通过称为挖矿的电脑运算来发行。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

随机森林技术

在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。而"Random Forests"是他们的商标。这个术语是1995年由贝尔实验室的Tin Kam Ho所提出的随机决策森林(random decision forests)而来的。这个方法则是结合Breimans的"Bootstrap aggregating"想法和Ho的"random subspace method" 以建造决策树的集合。

图像生成技术

图像生成(合成)是从现有数据集生成新图像的任务。

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的机率变得很困难,这也是要使用近似的平滑n元语法(N-gram)模型之原因。

推荐文章
暂无评论
暂无评论~