蜜度推出自研行业大模型蜜巢系列,预计年底将公布千亿级基座模型|WAIC 2023

661次阅读
没有评论

蜜度推出自研行业大模型蜜巢系列,预计年底将公布千亿级基座模型|WAIC 2023

蜜度参展2023年世界人工智能大会(来源:钛媒体App编辑拍摄)

随着人工智能(AI)大模型热潮以及中国支持 AI 产业发展,国内 AI 企业发现新机遇。

钛媒体App 获悉,7月6日至8日举行的2023世界人工智能大会(WAIC)期间,语言智能科技企业上海蜜度信息技术有限公司(MIDU,以下简称“蜜度”)发布自主研发的3个行业领域AI大模型,应用于出版、媒体、政务、教育等行业。

具体包括用于辅助写作、新闻稿件辅助生成的蜜巢知识问答与内容生成大语言模型,是首个软硬件一体国产化知识问答与内容生成大语言模型;国内首个智能校对领域大语言模型“蜜度文修”;蜜巢智能舆情分析大语言模型,以及旗下生成式 AI(AIGC)应用产品“蜜小豆”、“文稿通”等。

蜜度首席技术官(CTO)刘益东对钛媒体App表示,此次发布的三款行业垂直领域大语言模型,参数量在几十亿左右,优势在于语料质量高、公司对数据积累和理解能力较强、有丰富的经验更好落地服务客户等。目前,蜜巢系列行业大模型已逐步尝试部署在政务、媒体等内容生产强需求场景当中。

据悉,蜜度成立于2009年,是一家以 AI 技术为核心的语言智能科技企业,专注于多模态多语言智能科技,利用跨模态检索(CMR)、多语言校对(MLC)、计算机视觉(CV)、自然语言处理(NLP)、知识图谱(KG)等技术,为政府和企业各类办公场景提供智能应用软件产品,以及全方位的智能应用解决方案。

天眼查信息显示,蜜度公司股东中有北京微梦创科创业投资管理公司,持股比例21.57%。同时,去年9月6日,蜜度宣布与华为昇腾深度合作,目前蜜度已使用华为云基础设施产品展开业务商业落地。

刘益东于2009年参与创办蜜度,现任蜜度CTO,主要负责公司技术研究与应用工作,推动 AI 技术应用落地。刘益东毕业于哈尔滨工业大学,获计算机专业工学学士学位、软件工程硕士学位,而且拥有18年互联网行业从业经验、10年大数据研发经验。

刘益东认为,此次蜜度发布大模型产品并不是“蹭热点”,而是有很多行业数据积累形成的技术产品落地。他告诉钛媒体App,蜜度自2015年起专注于语言智能技术方向,在多模态、中文互联网数据积累上有一定优势,尤其是行业数据、客户理解积累上优势明显,有数据内容和生成场景。

具体来说,蜜度自主研发的蜜巢知识问答与内容生成大语言模型,专注于政府与企业内部定制化内容生成的场景,模型能够实时基于用户所输入的文档进行知识增强,并对文档中的相关知识进行定制化的知识问答与内容生成,真正实现“千文千面,千人千面”式内容生成,打造属于每个人自己的知识问答与内容生成大模型。同时该模型适配华为全栈国产软硬件一体化生态,可在专网环境本地部署使用,提供更加高效、稳定和安全的定制化内容生成服务。

而蜜度文修是蜜度自研的国内首个专为智能校对领域打造的垂直大语言模型,以大语言模型(LLM)为技术底座,通过运用高质量数据学习多种特色子任务,大幅度提升中文校对和润色能力的智能化程度。不仅辅助专业用户提高校对质量、提升校对速度、降低差错率,在新闻出版、媒体、政务、央企国企、教育等行业实现快速落地。

蜜度推出自研行业大模型蜜巢系列,预计年底将公布千亿级基座模型|WAIC 2023

值得一提的是,去年WAIC大会期间,蜜度就展示了 AI 图像生成、智能文本校对的技术能力,比如智能文本校对语音助手“蜜小校”等产品。

刘益东直言,过去半年间,团队一直致力于打造优质数据构建、数据训练输出能力,以此形成ChatGPTDALL·E 2这类产品的对话交互、高质量图像生成的优质体验。而与GPT不同的是,蜜巢大语言模型更多用于政务、媒体行业等垂直领域,并非ChatGPT这种千亿级通用大模型。

对于企业使用私有云造成大模型难迭代的话题,刘益东向钛媒体App透露,相对于阿里、字节等大公司的基座大模型,蜜度更多是把企业自身的公开数据进入蜜巢大模型知识层中,做一些简单的知识问答、命题写作等方案,然后在企业自身环境中去部署蜜巢大语言模型,注入企业自身的知识库“内循环”升级迭代,而不是做定制化大模型方案。

蜜度推出自研行业大模型蜜巢系列,预计年底将公布千亿级基座模型|WAIC 2023

算力是当前 AI 大模型发展的重要挑战,英伟达显卡成为大模型的“入场券”。刘益东表示,目前蜜度拥有的算力可以支撑十亿级大模型自主训练。而从长期布局,蜜度主要将控制参数规模、控制算力成本,另外扩展云端数据中心这种临时性算力方案,以解决未来更大参数、庞大规模训练等需求响应。据悉,自去年开始,蜜度和华为 AI 算力产品深度合作,而华为的算力也在支持蜜度做国产化大模型,整个产品更自主可控。

刘益东认为,当前 AI 大模型行业应用仍面临三重挑战:一是客户场景能不能支持这种投入产出比;二是大模型在云端的能力能否实现过程的安全可控,让客户放心;三是服务好一个垂直的垂直行业,需要关注不同方面的个性化需求,通用大模型很难全面满足。

刘益东向钛媒体App透露,基于当前十亿级参数的垂直领域大模型基础,以及开源生态发展、大模型基座模型训练、算力能力增长等因素,接下来蜜度团队将全面打造蜜巢行业基座大语言模型,预计2023年底前,蜜巢将实现百亿级别参数、千亿级Token以及聚焦行业场景的泛化能力。

“我们还是会聚焦目标市场,以给客户提供优质 AI 产品跟服务为己任,这是我们公司的定位。我们都在探索垂直行业的大模型工作,希望能在现有需求基础上,能迅速把 AI 大模型商业化并形成规模效应。”刘益东表示,蜜度希望其大模型产品能为中国数字经济做出一定贡献。(本文首发钛媒体App,作者|林志佳)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy