首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧

1,010次阅读
没有评论

首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧
由阿里巴巴集团、阿里云、达摩院联合中国电子技术标准化研究院编写的《生成式人工智能治理与实践白皮书》(以下简称“白皮书”),已经编写完成。白皮书简介请点击👉《生成式人工智能治理与实践白皮书》抢先版发布!如何给生成式人工智能带好“安全带”?
首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧本书从生成式AI发展的态势和担忧出发,探讨了生成式AI产生的风险,分析了风险产生的原因,提出了敏捷治理、协同共治的治理理念;同时,分享了我们在生成式AI不同环节的风险治理实践和探索,为各界提供有益的参考。
首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧
现陆续分享部分精彩内容。以下为第一章《生成式人工智能的发展以及担忧》👇
首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧
首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧 2022年11月30日,OpenAI发布了对话式通用人工智能服务ChatGPT。仅推出5天,用户数就超过100万;上线两个月后,用户数突破1亿,成为AI界的顶流。ChatGPT能遵循人类指令完成各种认知型任务,包括交互对话、文本生成、实体提取、情感分析、机器翻译、智能问答、代码生成、代码纠错等,并且展现出了和人类近似的水平。2023年3月15日,GPT-4发布,在知识推理以及逻辑运算方面有大幅提升,还支持多模态输入,进一步扩展了应用场景。
ChatGPT成功背后的技术突破主要有以下三个方面:
1.超大规模参数的预训练语言模型
为了使模型具备通用的能力,必须学习到世界知识,这要求模型具有足够大的参数量来存储海量的世界知识。GPT-3.5的模型参数已经达到1750亿的规模。随着模型参数量的扩大,语言模型还出现能力涌现的现象,例如上下文学习(In-context Learning),以及思维链(Chain Of Thought)等推理能力。
2.多任务的自然语言预训练模型
自然语言处理任务包括问答、机器翻译、阅读理解、摘要、实体抽取等,之前的学术研究都在特定的任务下进行针对性的算法设计,迁移性差。而ChatGPT采用了多任务预训练的方式,不同任务共享模型参数。这使得模型具有通用能力,下游任务不再需要微调,直接通过提示学习或者零样本学习就具有很强的性能。
3.基于人工反馈机制的强化学习
OpenAI通过引入指令微调以及基于强化学习的微调技术,提升模型和人类的价值观对齐。具体来看,指令微调技术使语言模型得以支持用户以人类惯常的沟通方式,与模型进行互动并推动模型能力的提升。同时,通过人工反馈和标注数据,借助强化学习进行微调,从而确保模型具备正确的价值观。
在应用上语言大模型构建了“多场景、低门槛、高效率”的共创应用新模式,具有丰富的应用场景,在医疗、教育、零售、媒体等行业完成产品落地应用。根据全球管理咨询公司麦肯锡(McKinsey)的报告,生成式人工智能的新兴主导地位为新一轮经济革命奠定了基础,估算每年能为全球经济增加 4.4 万亿美元收入。
首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧
2022年2月,开源工具AI绘画工具Disco Diffusion发布,这是一个在 Google Colab上运行的代码,其原理是使用了CLIP-Guided Diffusion,只需要输入文本提示,就能生成对应的图片。同年4月,OpenAI发布了Dall-E2,能够生成更高分辨率和真实性的图像。同时,AI绘画工具Midjourney发布。Google在5月、6月分别发布AI作画的技术,Imagen和Parti。7月份,Stability AI在LAION 5B开源数据集上训练了文生图扩散模型Stable Diffusion,生成的图像形象逼真,画质细腻。
技术的开源,极大地推动了图像生成领域的发展。2022年8月,在美国科罗拉多州举办的新兴数字艺术家竞赛中,参赛者提交了使用模型生成的绘画作品《太空歌剧院》,获得了“数字艺术/数字修饰照片”类别一等奖。参赛者并没有绘画基础,通过AI绘图软件MidJourney耗时80个小时创作了该作品。这意味着AI绘画的质量已经达到了专业水平。
进入到2023年,AI绘画继续井喷式发展。2023年3月,百度发布的文心一言支持了文本生成图像,Adobe也发布了AI工具Firefly。也是在3月,MidJourney V5发布,生成质量更高,而且支持自然语言的描述输入,使得AI绘画的门槛进一步降低。阿里巴巴于7月推出了新的绘画AI“通义万相”。科大讯飞、商汤、华为等人工智能企业也陆续推出文生图大模型产品,国内呈现“百模大战”的竞争格局。
AI绘画的技术突破式发展依赖以下3个技术的积累和突破::
1)在生成式模型方面,扩散模型的提出使得图像生成技术在基础理论上取得了突破。扩散模型(Diffusion Models)相比生成对抗网络(GAN)和变分自编码器(VAE),具有训练更加稳定,采样过程可控,生成的样本质量更好等优点。
2)在图文对齐模型上,OpenAI的CLIP模型的提出为文本和图像两个模态构建了桥梁,奠定了文本生成图片的技术基座。
3)VQGAN,VQVAE这类视觉量化生成模型,可以将图像压缩到量化的隐空间,从而为高效的隐空间扩散模型训练提供了基础。
此外,可以通过微调开源的Stable Diffusion模型来开发定制化的AI绘画模型,这使得AI绘画模型出现了百花齐放的现象。同时,AI绘画的技术也通过引入更多的其他信息辅助生成想要的图片,使得结果更加可控。例如近期的ControlNet,通过引入另外一个图片作为条件信息,控制文本生成的图片的风格,进一步提升了可用性。
文生图在多个行业上具有广泛的应用前景,例如在广告行业,AI制作宣传海报;在设计行业,AI辅助艺术创作、服装设计等;在电商行业,有虚拟模特、虚拟试衣等应用场景。另外,文生图在游戏和漫画等行业的应用也会加速内容制作的速度。

首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧


语言大模型、视觉大模型等通用大模型就像一个高中生,具有了基础的逻辑、认知、知识处理等通用能力;随着行业、产业对智能化需求的升级,不少领域已经开始对通用大模型这位“高中生”开展进一步的专业训练,让其成为行业领域的专家,提供专业领域的咨询、服务、工作的行业大模型。相较于通用大模型,行业大模型具有定制化、易部署、可微调、强安全等特点,能够有效适用于具体应用场景,更准确解决专业领域问题,提升行业效能。目前,部分行业大模型已经在电力、交通、金融、能源、民生服务、互联网等行业的智能化中崭露头角。
例如,智能办公提效需求强烈,也是AI大模型赋能优先级最高的场景之一。以企业协同工具钉钉为例,2023年4月正式接入通义千问大模型后,群聊、文档、视频会议及应用开发的智能化场景作为首发,通过输入“/”魔法棒可以唤起10余项AI能力,智能化程度显著提升,减少了人工重复操作成本,升级成为智能协同办公平台+智能应用开发平台。

首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧

大模型在医疗领域有广泛的应用,在患教助手、问诊在线值班医生、医疗随访、临床辅助决策和过程质控、影像助手、临床科研助理、药物研发数据洞察、医疗保险助手等场景都可以发挥巨大作用。阿里健康基于以上场景,致力于研发“先进且可靠”的垂直领域大模型,通过使用万级的书籍文献,并结合专家经验,通过专家审核,构建了十万级疾病词条和百万级医患问答、百万级别医学术语集、全病种疾病及合理用药知识图谱,在各类平台及各级医疗机构的信息集成、专业语言理解及归纳总结等方面实现了突破,目前已达到一对一个性化咨询服务、提升愈后跟踪性研究效率等成效。首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧

首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧


1.4.1 生成式人工智能大模型的软件供应链不断完善



越来越多的应用开发者希望集成语言大模型 (LLM) ,提供更智能化的服务,LangChain应运而生。LangChain是一个强大的框架,旨在帮助开发人员使用LLM构建端到端的应用程序,提供了一套工具、组件和接口,可简化创建由LLM提供支持的应用程序的开发过程。

同样地,在视觉大模型领域开源了基于Stable Diffusion的AI绘画图形化Stable Diffusion WebUI,支持多系统且具有很好的扩充性,非专业人员也能通过页面交互使用文生图大模型进行图像生成。这使得视觉生成模型被开发者集成和使用的难度大幅降低。

综上所述,生成式人工智能大模型相关的基础软件设施也在不断完善,使得基于大模型的应用开发也更加便捷、成本更低。


1.4.2 开源共享平台降低了大模型的训练和使用门槛

  • Hugging Face,业界最大的开源模型平台,大模型的使用更加简单。

Hugging Face是一个开源的自然语言处理AI工具平台,其在github上开源的Transformers库以及Diffusers库,已经成为生成式人工智能领域最受欢迎的开源库。除了开源代码,Hugging Face上还有大量的开源模型,例如知名的LLama系列、Stable Diffusion等,目前已经共享了超过10万个预训练模型,1万个数据集,成为机器学习界最大的开源共享平台。

  • CivitAI Stable Diffusion模型社区,丰富Stable Diffusion模型库。

Civitai是基于Stable Diffusion的模型共享社区网站,汇集了1000多个不同风格、不同主题的模型。用户可以上传自己基于Stable Diffusion微调的模型,也可以下载其他用户共享的模型,直接进行图像生成。这使得开发者不用训练就能根据自己的喜好获得模型,大幅降低了使用成本。

  • 云计算助力生成式人工智能,MAAS的服务方式逐渐成形。 

生成式人工智能的发展推动了云计算和人工智能的高度融合,全面智能化时代正在加速到来。云计算的服务模式将从以往的IaaS,PaaS,SaaS发展为Maas。逐渐形成了以模型为中心,以模型为服务,以模型为核心的AI开发新范式。

🌟 下期预告第二章:生成式人工智能的内生问题与社会担忧

首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧

AAIG一直秉持着精益求精的态度,坚持每年出品一本人工智能治理白皮书。我们都会不断更新、优化,以确保白皮书能够紧跟时代发展的步伐,为读者提供更加专业、全面的治理建议。


首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧

点击阅读👉2022年《人工智能治理与可持续发展实践白皮书》


📺直播预告

  • 10月31日19:00《追AI的人》第31期

首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧

  • 11月1日19:00《追AI的人》第32期

首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧📌往期推荐🌟《人工智能治理与可持续发展实践白皮书》 精华大图集锦版 | 如何维护电商平台信息真实和竞争公平…👉点击查收白皮书全书连载
🔥《追AI的人》系列直播教你掌握互联网的“流量密码”  | 如何避免ChatGPT被滥用👉点击查收过往30期直播的全部文字回放
🎈算法治理制度》系列丛书内容和电商领域推荐算法的应用与治理差异“大数据杀熟” 的背后👉点击阅读更多算法治理干货
📚《AI治理必修》月刊为什么现在的LLM都是Decoder-only的架构? | 大脑视觉信号被Stable Diffusion复现成图像!”AI读脑术”来了👉点击阅读往期40刊月刊全文
📺 AI治理科普短视频流量为王的时代,教你如何“破圈”创作 3分钟Get多模态是什么? 信息茧房和马太效应是什么👉点击观看往期21期精彩视频

👇AAIG课代表,获取最新动态就找她首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧

 关注公众号发现更多干货❤️

首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧
首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧有启发点在看喔👇首发!《生成式人工智能治理与实践白皮书》第一章:生成式人工智能的发展以及担忧

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy