人工智能 (AI) 利用计算机和机器来模仿人类思维的解决问题和决策能力
"人工智能分析"- 语言模型和API提供商的独立分析
全新的时代,AIGC(Artificial Intelligence Generative Content,即人工智能生成内容)正在重新塑造着内容创作生态。当常识能被机器识别,当艺术被重新定义,当创意不再需要人工,广告营销行业将迎来一场生产变革巨浪。
基本概念/理论
AI 工作原理
AI,全称Artificial Intelligence,人工智能。顾名思义,让机器发展出像人一样的智能,可以看到、听到、思考、判断,然后根据经验作出决策。
而AI之所以能够走向现实生活,影响到多个行业领域的生产工作,离不开三个重要技术的支撑:深度学习、神经网络以及生成式对抗网络(GAN)。
神经网络
神经网络是一种模拟人脑神经元连接的算法模型。你可以把神经网络想象成一个大脑。就像大脑由许多神经元相互连接构成,神经网络也由许多"节点"或"神经元"通过"链接"相互连接。这些链接就像我们大脑中的神经连接,可以传递和处理信息。
深度学习
如果说神经网络像一个普通大脑,深度学习则是一个更加“聪明”的大脑。在这个“大脑”里,神经元被组织成许多层,这就像大脑的不同区域处理不同的任务一样。每一层都在学习和处理数据的不同特征或部分。这就使得深度学习能够处理非常复杂的问题,比如识别图像或理解自然语言。
生成式对抗网络(GAN)
GAN技术可以说是推动这次AIGC热潮的关键技术,有了它,AI才能够生成逼真的图像、音频和文本。
你可以把GAN的工作原理想象成是一个艺术家和艺术评论家的竞赛。艺术家(生成器)的工作是创造看起来真实的艺术作品,而艺术评论家(判别器)的任务是判断这个作品是否真的来自真正的艺术家,还是来自我们的AI艺术家。 艺术家(生成器)开始时可能不太擅长制作逼真的作品,而评论家(判别器)也可能并不擅长识别真伪。但是,随着他们不断的竞争,艺术家的作品变得越来越逼真,评论家的判断能力也越来越强。 在这个不断生成和对抗的过程中,AI逐渐学会了如何创作看起来非常真实的作品。
AI大模型/预训练大模型
AI大模型是一种机器学习模型。它可以学习和处理更多的信息,比如图像、文字、声音等,也可以通过训练,完成各种复杂的任务。比如智能语音助手和图像识别软件都会用到AI大模型。 这里的「预训练」,可以理解为像学生学习知识一样,机器也需要通过学习和训练来获取相关的知识和技能,来完成各种任务。AI预训练大模型可以通过不同领域的大量训练,掌握知识和技能。
由OpenAI公司开发的模型GPT就是一种大型语言模型,也是预训练模型的一种,它能够自动生成各类文本,比如新闻报道、小说,也可以回答问题、写文章、进行对话。GPT是目前自然语言处理领域最为先进的自然语言生成模型之一。
开源
开源可以被理解为分享和合作的一种方式。在计算机编程中,当一个项目是开源的,意味着它的源代码是公开的,任何人都可以查看,修改和分享。
自然语言处理(NLP)
自然语言处理(NLP)就像是教计算机理解和使用人类语言的一种技术。自然语言处理需要用到很多开源的工具和软件,它们能够帮助研究员处理语言数据,大大降低开发的门槛,让自然语言处理技术的进步的速度变快。
AIGC
AIGC(AI Generated Content )是指由AI自动创作生成的内容,即AI接收到人下达的任务指令,通过处理人的自然语言,自动生成图片、视频、音频等。来自AI的理解力、想象力和创作力的加持,它可以根据指定的需求和样式,创作出各种内容:文章、短篇小说、报告、音乐、图像,甚至是视频。这个新类别被称为“生成式AI (Generative AI)”。
人类擅长分析事物,而机器在这方面甚至做得就更好了。机器可以分析一组数据,并在其中找到许多用例(use case)的模式,无论是欺诈还是垃圾邮件检测,预测你的发货时间或预测该给你看哪个视频,它们在这些任务中变得越来越聪明。这被称为“分析型AI(Analytical AI)”,或传统AI。从用户生成内容(UGC),到专业生成内容(PGC),再到现在的人工智能生成内容(AIGC),我们看到了内容创作方式的巨大变革和进步。
AIGC可以生成的内容
AIGC可以生成的内容很多,具体的种类和范围可能随着技术的发展而不断扩大。目前,一些常见的AIGC内容包括:
- 文字:最基本的AIGC内容,可以与人类进行实时对话,生成不同风格的文字,诗歌、故事,甚至计算机代码等。
- 图像:可以由文字或者图片,直接生成各种类型的图片。可以辅助人类进行绘画设计和发散想象力,大致可以分为图像自主生成工具和图像编辑工具两类。
- 视频:可以通过文字描述,生成一段情节连贯的视频。比如广告片、电影预告片、教学视频、音乐视频等。也可以当作视频的剪辑工具。
- 音频:可以生成逼真的音效,包括语音克隆、语音合成、文本生成特定音,音乐生成、声音效果等。
- 游戏:游戏的剧情设计、角色设计、配音和音乐、美术原画设计、游戏动画、3D模型、地图编辑器等都可以让AIGC帮助完成。
- 虚拟人:可以生成虚拟明星、虚拟恋人、虚拟助手、虚拟朋友等。指存在于非物理世界(如图片、视频、直播、一体服务机、VR)中,并具有多重人类特征的综合产物。
常见的AIGC应用
人工智能的运用已经广泛渗透到我们的生活和工作中,例如:
- 人工智能机器人: 能够模拟人类智能和行为的机器。人工智能机器人的目标是能够理解和响应复杂的环境,执行多种任务,与人类和其他机器人交流和合作。如ChatGPT聊天机器人,他能理解人的语言,用人类语言进行对话。并能够用特定传感器采集分析出现的情况。调整自己的动作来达到特定的目的。
- 语音识别和自然语言处理:许多智能手机和智能音箱都可以通过语音命令来控制,例如苹果的Siri,谷歌的Google Assistant,亚马逊的Alexa等。这些设备都利用了人工智能的语音识别和自然语言处理技术,可以理解用户的语音输入,并给出合适的回答或执行相应的操作。
- 图像识别和计算机视觉:人工智能也可以帮助我们识别图像中的物体,人脸,场景等,例如脸书的Face ID,微软的Azure Cognitive Services,百度的百度云视觉,汽车车牌号的辨识等。这些服务都利用了人工智能的图像识别和计算机视觉技术,可以对图像进行处理分析,标注,搜索,编辑等功能。
- 机器学习和数据挖掘:人工智能也可以帮助我们从海量的数据中提取有价值的信息,预测未来的趋势,优化决策等,例如Netflix的推荐系统,谷歌的搜索引擎,阿里巴巴的天猫精灵等。这些应用都利用了人工智能的机器学习和数据挖掘技术,可以根据用户的行为,偏好,历史等数据来提供个性化的服务,增加用户满意度和忠诚度。
- 智能算法:解决某类问题的一些特定模式算法,例如,我们最熟悉的最短路径问题,以及工程预算问题的等。
常用软件
- ChatGPT: ChatGPT是由OpenAI开发的一款大型预训练语言模型,就像一个会聊天的机器人。 它可以理解你说的话,并给出回答。这个机器人在互联网上读了很多书、文章,学到了很多知识,所以可以回答各种问题,甚至进行深入的讨论。不过,ChatGPT的理解与人类不同,人类理解事物时,有意识、经验和情感等多个层次的参与,而ChatGPT只是通过分析和模拟大量的文本数据来"学习"如何合理地回应。
- Midjourney: 是由美国旧金山的一家独立研究实验室创立的图片类AIGC应用程序,我们可以通过语言描述来生成图片。
- Stable Diffusion: 图片生成类AI大模型,可以在给定的任何提示词下生成图像,并支持根据关键词和图片检索。与Midjourney相比,生成图像的结果更可控。
- Copilot : 就是搭载了GPT-4的Edge浏览器,它能够更好地理解用户意图,提供更加智能化、个性化的搜索和服务体验。
AIGC在广告营销中的运用
随着AIGC的浪潮在现实中涌动,多个行业迎来了自我更迭的新机遇,广告行业也开始拥抱AIGC。从文本应用、图片应用、视频应用、市场分析的四个层面,探寻与AI共事的进击之路。
- 文本应用: 当ChatGPT走进大众视野时,我们看到不少人感叹它强大的表达能力和迅猛的反应能力,无论向它抛出什么样的问题,它都能对答如流,甚至对于同一命题,也能给出许多不同的答案。
- 图片应用: AIGC的出现,不仅提速人们在绘图工作中的效率,更解锁了绘画创作的更多可能性,带来一些在艺术审美上的灵感。不得不说,AI的想象力、审美力和创作力,已然被更多人所见。
- 视频应用: 以往,制作广告的工作流是贯穿线上线下,线上对接脚本,线下注重执行,尤其是现场拍摄,一些不可抗力的因素会影响到计划进度。 如今,随着AIGC的横空出世,内容生产的工作流正发生着不小的改变,创作者可以选择纯在线上完成广告任务。即向AI发生任务指令,再通过线上的一些调试,便能形成一支广告片。
- 其他营销应用: AI不仅仅能够提供创意内容,还能帮助品牌与商家优化媒介投放和客户管理系统。比如,阿里妈妈发布的序列化智能投放技术,就是借助AI技术帮助商家实现合理投放;巨量引擎则使用了与GPT相同的transformer技术,帮助客户高效提升ROI。
AI领域新兴职业
提示词工程师
提示词工程师像是AI模型的导演,负责设计和优化指导AI行动的语言提示。 他们了解AI模型的工作原理,并使用这些知识来优化语言提示,从而引导AI模型产生更好的结果。他们的工作可以涵盖多种任务,比如提升AI对问题的理解,优化AI的回答,甚至引导AI生成全新的内容。这项工作更偏向语言艺术和人工智能的交叉领域。
提示词艺术家
提示词艺术家是AI的艺术合作者,用创意和技巧指引AI创建出吸引人的艺术作品。 他们可能会使用像Midjourney这样的图片生成模型,通过提供特定的提示词或语句,来生成新奇和独特的文本或图像内容。他们需要有深厚的艺术素养,同时也需要对AI模型的工作原理有一定的理解,以便能够精确地指导模型产生预期的艺术作品。
人工智能训练师
人工智能训练师就像是AI模型的教师,他们主要关注如何训练和优化AI模型。 他们为AI模型提供训练数据,监督学习过程,并调整模型参数以改善其性能。这些工作主要涉及到机器学习和深度学习的知识,需要对AI技术有深入的理解。
AI的未来,机遇和挑战共生
多模态AI, 即能够处理和理解多种类型数据(例如图像、文本、音频等)的人工智能。目前的AI技术大多只能处理文字数据,而多模态能够理解更多类型的信息。
AGI (Artificial General Intelligence),即“人工通用智能”,这是另一个与AI未来相关的高频词汇。它指AI能够在所有领域中,像人类一样学习各种知识,完成各种任务。AGI是人工智能的一种理想状态,也可以说是AI研究的终极目标,即让机器拥有与人类等同的智能。 现在的AI技术,虽然在特定任务上表现出超越人类的能力(如围棋、图像识别等),但它们仍然只是“窄”AI,仅限于特定任务。
"Artificial Analysis (人工智能分析)"
"人工智能分析 (英文)" 提供基准测试和相关信息,以帮助选择最佳模型和API提供商。
参考“一次性搞懂什么是AIGC” -数英DIGITALING