购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.1
ChatGPT

人工智能的具体成就中,ChatGPT有一席重要的地位,ChatGPT是OpenAI开发的一种基于Transformer架构的语言模型,属于生成式预训练模型(GPT)的一种特定变体。它的主要功能是生成自然对话,利用深度学习技术处理自然语言任务。Transformer架构通过自注意力机制来处理和理解序列数据,有效捕捉长距离的依赖关系,从而显著提高自然语言处理的效果。因此,ChatGPT可以理解和生成人类语言,支持多种自然语言处理应用。

2.1.1 ChatGPT对话界面

ChatGPT的登录界面如图2-1所示,点击右上角的“登录”即可。

图2-1 ChatGPT的登录页面

跳转到如图2-2的界面,按照引导提示,输入电子邮箱和密码,即可登录ChatGPT。

图2-2 ChatGPT的登录页面

登录成功会跳转到ChatGPT的主页面,如图2-3所示。

图2-3 ChatGPT的主页面

如图2-3所示,可以看到ChatGPT的主页面中分别有模型选择、定制选项、历史对话和聊天框。可以针对不同场景选择适合的工具即可。

在ChatGPT的模型选择区域中,现阶段有如图2-4等众多模型可供选择。需要注意的是,ChatGPT是在实时更新,请以实际为准。

图2-4 ChatGPT的模型选择

在日常使用中,我们可以根据自己需求选择合适的模型即可。

在ChatGPT的定制选项中,可以定制或搜索专属的GPTs,所谓GPTs其实就是ChatGPT的自由定制版,它可以让使用者量身打造属于自己的AI工具。可以搜索与需求相关的GPTs,如图2-5所示,点击ChatGPT的定制选项,选择“探索GPT”(英文版显示为:Explore GPTs)即可进入GPTs的搜索页面,如图2-6所示。

图2-5 GPT的工具栏

图2-6 GPTs的搜索页面-1

我们可以在搜索框中输入“电商直播”,如图2-7所示,即可搜索关于“电商直播”的GPTs,点击即可使用。

图2-7 GPTs的搜索页面-2

使用者可以通过上传资料来自定义符合自己需求的GPTs,创造出符合自己需求的AI助手。具体操作过程类似于搜索的过程,首先打开ChatGPT的操作页面,选择“探索GPT”,在下一个窗口中点击右上角的“+创建”,如图2-8所示,就可以创建自己的GPTs了。

图2-8 GPTs的创建界面-1

接着会出现一个新的界面,如图2-9所示。在机器人建立区域(2-9上图),分为“Create”(创建)和“Configure”(配置)两个功能标签。

创建标签下的内容大意是:嗨!我会帮你建立一个新的GPT。你可以说“创建一名创意人员来帮助生成新产品的视觉效果”或“创建一名软件工程师来帮助格式化我的代码”。你想做什么?

我们可以跟GPT Builder进行对话,这是定义GPTs的行为和功能的阶段,这个时候我们就要输入前面第一点里面的定义目标了,比如说提供“我们要创建一个‘电商直播’的机器人,它专注于电商直播的相关内容,提供直播的援助”的指令,GPT Builder会根据这些资料进行设定。

切换到“配置”标签后,我们可以进一步精致化自己的GPTs。在这里,为自己的GPT命名、添加描述、设定具体指令和对话开端(Conversation starters),上传相关知识文件,这些文件将作为GPT提供回答的资料来源。还可以设定GPTs的能力,比如,是否授权它能浏览网页、使用DALL·E生成图片或解析代码。

在预览区域(2-9下图),我们可以及时和自己创建的GPTs对话,来体验创建的GPTs是不是符合自己的要求。

图2-9 GPTs的创建界面-2

创建自己的GPTs的过程,就像是在和ChatGPT对话。GPT Builder会询问你希望的GPTs的运作方式,接着上面例子,他会告诉你,把这个GPTs命名为“电商直播助手”,是不是可以,如图2-9所示。

我们直接回复“当然可以”,如图2-10所示。它会继续带领设定机器人,设定名称,设计出一个代表性的机器人的头像。

图2-10 GPTs的创建界面-3

接着,它会继续提出一系列的问题,帮助我们继续完善这个机器人。我们可以不断根据它的问题,调整和改进自己的GPTs,如图2-11所示。

图2-11 GPTs的创建界面-4

最后,要把我们自己创建的GPTs保存起来,点击上面的“创建(英文为Create)”,如图2-12所示,并在弹出的界面中点击保存(英文为save)即可,如图2-13所示。我们就可以使用我们自己定制的GPTs了。

图2-12 GPTs的保存界面-1

图2-13 GPTs的保存界面-2

在ChatGPT的主操作页面中可以看到你的所有GPTs,若需要进行修改或删除,直接点选相应的按钮即可。

2.1.2 ChatGPT的视频工具

2024年2月16日,OpenAI公司正式发布了Sora文生视频的模型。

Sora是OpenAI开发的一种视频生成大模型,它利用先进的人工智能和虚拟现实技术,它能够根据文本、图片甚至视频等文件直接生成高质量的视频内容,生成的视频画面非常精细,有丰富的场景和生动的角色表情等等。

我们要想使用Sora,首先需要打开OpenAI的官方网站,然后点击最上方的Research菜单,在弹出的下拉菜单中选择“Sora”,就可以来到Sora的主页面,如图2-14所示。

图2-14 Sora的主页面

Sora的功能非常强大,我们结合官网的一些案例来详细讲解其中的2个相关的核心功能。

(1)文生视频

结合我们做短视频的文案,获取了比较完整的文案内容,那么我们可以利用文字来创造视频。Sora在进行文生视频的过程中,主要是结合先进的人工智能技术,结合自然语言的生成算法以及具体指令,来生成相应的视频内容。

我们来看一个案例。

案例1:一位女士穿过街道(图2-15)

图2-15 Sora生成的视频1:一位女士穿过街道

这段AI生成的视频使用的提示词是这样的:

Prompt: A sty l ish woman wal ks down a street fi l led with warm glowing neon and animated city signage.She wears a b lack leather jacket, a long red dress, and black boots, and carr ies a black purse.She wears sung lasses and red l i pstick.She wal ks confidentl y and casual ly.The street is damp and reflective, creating a mi rror effect of the colorful l ights.Many pedestr ians wal k about.

翻译成中文的大概意思如下:

一位时尚的女子走在街头,街道上充满了温暖的霓虹灯和动态的城市标牌。她穿着黑色皮夹克,红色长裙和黑色靴子,手提黑色手提包,戴着太阳镜和红色口红。她自信而随意地走着。街道潮湿,反射出五彩缤纷的灯光。许多行人来来往往。

可以看到上面这个AI视频里面的几个场景。一个充满着现代感的夜景街道,打造出来了一种电影般的视觉效果。路上的场景虚化,一位女士走在大街上,由远及近地表现出动态感,增加了许多活力。视频中的女主脸部的任何细节都展现的十分完美,根本感觉不到这是AI生成的画面。女主侧面的状态,更增添了个人的气质,我们都可以从中看到她的个人魅力和气场。

上面这个视频就是文生视频的代表,可以看到从简单的提示词中演绎出了虚拟的现实场景。在我们的短视频文案运作过程中,使用sora,将一些文案转化成提示词,可以进一步提高我们的短视频生成的效率。

案例2:美丽、白雪皑皑的城市景色(图2-16)

图2-16 Sora生成的视频2:美丽、白雪皑皑的城市景色

这段AI生成的视频使用的提示词是这样的:

Beautiful, snowy city is bustl ing.The camera moves through the bustl ing city street, fol lowing several peop le enjoying the beautiful snowy weather and shopping at nearby stal ls.Gorgeous sakura petals are flying through the wind along with snowflakes.

翻译成中文的大概意思如下:

美丽的雪城热闹非凡。镜头穿过繁忙的城市街道,跟随着几个人享受美丽的雪景并在附近的摊位购物。风中飘舞着美丽的樱花花瓣和雪花。

这属于是城市景色的视频,我们看到这类AI视频的效果,通过覆盖着白雪的景色,打造出浪漫冬日的氛围,镜头远近穿梭城市的景象,一男一女手拉手由远及近,观察他们在雪天的活动,根本看不到任何AI的痕迹,很像是真正下过雪的视频景色。自然元素的雪花和城市的街道建筑等融合,给人一种宁静和热闹并存的感觉。

我们可以采用这种方式生成城市类景色的视频,这种方法在视频的制作方面也有很广阔的应用前景。Sora技术可以让我们快速、高效地创建出各种风格迥异的城市景色视频,不需要受实际天气和地点、时间的限制,极大方便了我们的视频制作。

(2)图生视频

我们在前面讲过通过Dall-E3来生成图片,现在通过Sora加之提示词的引导,还可以把图片“动起来”生成一段短视频。Sora在接收到我们的图片素材之后,会对我们的图片进行特征提取,分析图片边缘、颜色和纹理等等,提取了相关的特征之后,再根据定义算法生成动态的效果。

生成的动态效果图片,配合提示词,应用到动态视频中,最后经过处理,组合成一段完整的视频。Sora再将处理后的视频按照一定的顺序排列组合,生成最终的动态视频效果。

案例3:旋涡图片

如图2-17所示,我们提供一张旋涡的图片。

图2-17 旋涡图片

将这个图片转化成动态视频的提示词如下:

I n an ornate,hi stor ica l ha l l,a mass ive tida l wave peaks and begins to crash.Two surfers seizing the moment,ski l lful l y navigate the face of the wave.

这段提示词翻译成中文如下:

在一个华丽的历史大厅里,一道巨大的海浪达到顶峰并开始崩塌。两名冲浪者抓住机会,熟练地驾驭着波浪的表面。

我们继续看一下,图片经过Sora大模型的处理生成视频的动态效果,如图2-18所示。

图2-18 Sora根据旋涡图片生成的视频

Sora根据图片生成的视频中,完美复刻了冲浪者在旋涡中的动态视频,根据有旋涡的图片,复刻了这个华丽的历史大厅,诠释了历史大厅和冲浪者以及浪潮之间的对比,这种碰撞展示了各种不同的融合,这个动态视频给我们带来了强烈的视觉和情感体验。

案例4:一个坐在云朵上读书的男人

如图2-19所示,我们提供一张坐在云朵上读书的男人。

图2-19 坐在云朵上读书的男人

我们使用sora看看能把这个图片生成一个什么样的动态视频,生成视频的提示词如下:

A young man at his 20s is sitting on a piece of cloud in the sky,reading a book.

这段提示词翻译成中文如下:

一个二十多岁的年轻人坐在天空中的一片云上,正在读书。

Sora根据这个简单的提示词,可以生成如下视频,视频的动态效果如下图2-20所示。

图2-20 Sora根据坐在云朵读书的男人生成的视频

从这段视频中,我们可以看出,最初提供的图片只是很简单的一个场景,sora根据技术实现了视觉上从远到近,从高到低的变化,天空中的白云从男主的身后飘过,让角色非常的立体和直观。

通过Sora所生成的视频,还可以基本具备动态摄像机运动效果的视频内容,比如说,它可以实现3D角度的自由变幻,仿佛我们可以融入这个场景中,为我们带来丰富的观景体验。

案例五:一段3D动画场景的特写视频

如图2-21所示,这是官网中所展示的一段3D动画场景的特写视频,根据用户输入的提示词,生成了一段非常逼真的3D动画。

图2-21 Sora生成的一段3D动画场景的“小怪物”视频

这段3D动画使用的提示词如下:

Animated scene features a close-up of a short f l uffy monster knee l i ng bes ide a me lti ng red cand l e.the art sty l e i s 3d and real istic, with a focus on l ighting and texture.the mood of the painting is one of wonder and cur iosity, as the monster gazes at the flame with wide eyes and open mouth.its pose and expression convey a sense of innocence and p layfulness, as if it is exp lor ing the wor ld around it for the fi rst time.the use of warm colors and dramatic l ighting further enhances the cozy atmosphere of the image.

翻译为中文的意思如下:

动画场景中,特写镜头展示了一个短毛的毛茸茸小怪物跪在一支正在融化的红色蜡烛旁边。艺术风格为3D且真实,重点突出灯光和纹理。画面的氛围充满了奇迹与好奇,小怪物睁大眼睛、张着嘴注视着火焰。它的姿势和表情传达出天真和顽皮,仿佛是第一次探索周围的世界。温暖的色彩和戏剧性的灯光进一步增强了图像的温馨氛围。

这段视频完美地展现了“小怪物”的3D效果,从低头、抬头到各个角度,就好像是我们实景看到它一样。蜡烛也是场景中的重点,蜡烛一直在燃烧,加上火焰的光芒都为这个视频增加了一种真实的氛围。

案例六:一段机器人的视频

如图2-22、图2-23和图2-24所示,机器人的视频效果也非常震撼,完美营造出了一个机甲的画面。我们可以从侧面、正面以及背面看到机器人的各种状态,而且不失真,机器人以及周边场景都可以高度保持一致。

图2-22 机器人的侧面

图2-23 机器人的背面

图2-24 机器人俯视正面

这段视频的提示词如下:

The story of a robot’s l ife in a cyberpunk setting.

翻译成中文如下:

赛博朋克背景下的机器人的生活故事。 H1DnDEylXfYgaDI/DcJBtpZF+9aw+ZSUQEsRJvw9aW4iEWdGNEgaLjDjs2Tes3mg

点击中间区域
呼出菜单
上一章
目录
下一章
×