澜舟科技通过生成式人工智能备案并重磅发布新版孟子GPT-金融模型和孟子GPT-Code模型

494次阅读
没有评论

12月26日,澜舟科技正式通过国家互联网信息办公室(以下简称“网信办”)颁布的《生成式人工智能服务管理暂行办法》(以下简称《办法》)备案,这也标志着澜舟科技在生成式人工智能领域的健康发展和规范应用方面迈出了重要一步。

《办法》是国家网信办联合国家有关部门共同制定,该法规明确了生成式人工智能技术的基本概念和服务提供者的制度要求,为行业的健康发展提供了强有力的法律支撑。该《办法》自2023年8月15日起施行。


澜舟将很快向公众发布孟子大模型及其核心能力。敬请期待。

澜舟科技是世界顶尖NLP专家周明博士(中国计算机学会副理事长,曾任NLP顶尖学会ACL学会主席和Fellow,原微软亚洲研究院副院长)创立。在2020年底在创新工场孵化阶段,就开始了大模型(当时叫做预训练模型)的研发,是国内最早开展大模型研发的创业团队,于2021年荣获北京HICOOL国际创业大赛最高奖励。孟子模型早在2021年获得CLUE中文大模型评测第一名,并已经在金融等领域落地。今年澜舟科技荣获达沃斯世界经济论坛全球技术先锋
ChatGPT于2021年底影响力崭露头角时,澜舟科技迅速捕捉到大模型的巨大潜力,并立即投入研发。今年3月,澜舟科技推出首个大模型产品:孟子GPT-通用-7B,受到了广泛关注。随后在8月份,澜舟科技再次发布了多款大模型:孟子GPT-通用-13B、孟子GPT-通用-40B、孟子GPT-金融-7B。孟子大模型凭借其卓越的性能,2023年8月在C-Eval、Superclue等权威榜单中均名列前茅。2023年8月澜舟科技发布了大模型的层次服务体系。此后不久,澜舟科技顺利通过了中国信通院可信AI评估“模型能力-大语言模型”专项模块验证并获得该模块4+级最高评分。这些认证不仅是对澜舟科技大模型技术实力的肯定,更是对其未来发展的有力背书。
AI大模型狂飙一年,市场逐渐回归理性,如何利用大模型赋能千行百业成为令人关注的焦点。澜舟科技创始人&CEO周明曾说过:“虽然大模型能力很强,但处理行业的具体场景时,它的能力还显不足,除此之外,还面临成本过高、数据泄露、模型幻觉等挑战”。大模型技术和市场应用风云变幻,如何从不确定性中找到确定性?针对挑战,澜舟科技在做ToB服务时,更关注模型的语言理解能力,坚持“大模型+ToB应用”的产品服务路线,面向企业客户提供灵活多样的大模型训练、优化、业务场景定制等服务能力,形成业界独特的“L1-L2-L3-L4”企业服务路线,即通用大模型、行业大模型、场景任务模型、AI Agents的四个层次服务体系和商业闭环,全面满足用户在各个层次的需求,帮助企业实现业务目标。
基于市场调研和模型应用落地反馈,经过3个多月努力,澜舟科技现正式发布孟子GPT-金融-13B大模型和澜舟的第一款代码助手大模型:孟子GPT-Code-6.7B大模型
这次发布凸显了澜舟科技对金融业务的全面支持。

01

孟子GPT-金融-13B行业大模型

孟子GPT-金融-13B行业大模型是专为金融领域打造的行业大模型,它经过深度训练和优化,能够精准理解和解答用户在金融市场、投资理财等相关主题的问题,同时也能编写各种金融分析文章、研究报告,以及完成各类金融信息的深度加工等任务。
相较于孟子GPT-金融-7B模型,孟子GPT-金融-13B模型在预训练阶段引入了更多的金融行业专业数据(5000亿tokens),包括新闻、研报、书籍、知识库等,使其在金融专业知识和任务上表现更优。同时,通过高效的模型优化算法和数据混合策略,这款模型不仅在金融相关任务上展现出更加出色的表现,还继承了通用底座模型的强大能力。
为了进一步提升模型在金融任务上的能力,在SFT(supervised fine-tuning)阶段,我们构建了高质量的数据集,并针对100+金融任务进行了优化。孟子GPT-13B金融模型在多项语言理解和语言生成的任务中展示出优越性能,包括实体识别、情感分析、事件抽取、语法纠错、文本生成、文本翻译、阅读理解、文本摘要等。为了增强模型的泛化能力,我们采用了 Few-Shot Learning、In-Context Learning、Cross-Lingual Transfer Learning、Chain-of-Throught 等技术,以支持众多面向金融场景的应用,这些技术有力地增强了模型的性能,使其能够更好地适应各种金融场景的需求。澜舟科技通过生成式人工智能备案并重磅发布新版孟子GPT-金融模型和孟子GPT-Code模型我们从实例中感受一下:
金融投诉分析

prompt

孟子GPT-金融-13B模型

我根据我的投资顾问建议购买了某风险型投资产品,现在发现本金都无法保住,请解释负责。根据以上内容判断客户为什么要投诉。

  1. 投资顾问没有充分告知该产品的风险;

  2. 投资顾问未能提供足够的信息和指导来帮助客户做出明智决策;

  3. 投资顾问存在欺诈行为或误导性陈述;

  4. 投资顾问违反法律法规规定,导致客户损失。

问题生成

prompt

孟子GPT-金融-13B模型

现在有这段“财务报表是企业定期发布的、反映企业财务状况和运营成果的报告。主要包括资产负债表、利润表、现金流量表等。财务报表是分析企业财务状况和经营业绩的重要依据。”文本,想为这段文本生成一个与下面例子不重复的问题用于匹配用户检索,这是一个例子:“什么是财务报表?

财务报表包含哪些内容?

文本纠错

prompt

孟子GPT-金融-13B模型

2023年,公墓行业的保有规模先升后降。自去年7月份保有规模首次突破27万亿元大关后,今年8月份更是首次创下28.8万亿的历史新高。但随着市场的整体震荡,保有规模开始出现缩水。截至10月底,公墓市场的保有规模仅为27.38亿元。

对上文进行纠错。

2023年,公募基金行业的保有规模先升后降。自去年7月份保有规模首次突破27万亿元大关后,今年8月份更是首次创下28.8万亿的历史新高。但随着市场的整体震荡,保有规模开始出现缩水。截至10月底,公募基金市场的保有规模仅为27.38亿元。

金融事件类型分析

prompt

孟子GPT-金融-13B模型

上证报中国证券网讯(记者邱德坤)6月12日,记者查询天眼查发现,近日,四川易冲科技有限公司(下称“易冲科技”)发生工商变更,四川省创新创业股权投资基金合伙企业(有限合伙)退出股东行列,新增股东为合肥蔚来产业发展股权投资合伙企业(有限合伙)。公开资料显示,易冲科技是一家无线充电芯片解决方案提供商,专注于磁共振耦合无线充电技术,主要产品是第二代无线充电技术的芯片和智能硬件。智慧芽显示,易冲科技近期主要专注于输入端、控制器、集成电路、输入信号、无线充电等技术领域,已公开专利申请66件,发明专利占比62.12%。上文中的主要事件类型是什么?

主要事件类型:公司股权变动

金融文本翻译

prompt

孟子GPT-金融-13B模型

翻译为英语:国金证券发布研究报告称,电子基本面在逐步改善,展望2024年,手机、电脑、服务器及IOT在AI创新驱动下需求有望逐步回暖,苹果MR持续创新有望快速推动行业发展,激发新的需求。中长期来看,Ai有望给消费电子赋能,带动电子硬件创新,带来新的换机需求,2024年看好Ai新技术创新驱动、需求转好及自主可控受益产业链。

Guojin Securities released a research report stating that the fundamental conditions for electronics are gradually improving, and looking ahead to 2024, demand for mobile phones, computers, servers, and IOT may gradually warm up under the driving force of AI innovations. Apple’s MR continues to innovate and has the potential to drive rapid industry development and stimulate new demand. In the long term, AI is expected to empower consumer electronics, drive electronic hardware innovation, and bring about new replacement needs. In 2024, we look forward to the innovative driving of AI new technologies, improved demand, and self-controllable beneficial industrial chains.

|孟子GPT-金融-13B大模型体验链接:https://www.langboat.com/product/mchat?model=mengzi-gpt-fin-13b

02

孟子GPT- Code-6.7B大模型

孟子GPT-Code-6.7B大模型是澜舟科技最新发布的一款功能强大、适应性强的代码助手,能够为金融领域和软件开发领域提供全面支持。它基于开源模型 DeepSeek Coder开发。为了进一步提升模型性能尤其是对金融领域编程的支持,孟子GPT-Code大模型引入了金融行业的数据进行预训练,并使用高质量的任务数据进行了微调,它支持中英文两种语言,并兼容100多种编程语言。
孟子GPT-Code-6.7B大模型在多项任务上的表现超越了众多编程开源模型。为了更好地支持金融领域,孟子GPT-Code-6.7B大模型专门针对代码进行了优化, 不仅保留了底座模型的通用能力,还在多种金融 Code 场景下取得了比通用模型更佳的效果。它适用于数据分析、图表绘制、指标计算、Text2SQL、数据库设计、文本分析、机器学习模型构建等任务。同时,孟子GPT-Code大模型还增加了软件开发需求文档写作的能力,对ER设计、方案设计、系统设计、任务规划、软件测试、数据安全等多个主题进行了专门优化。
接下来,我们从文本转SQL能力、数据分析、图表绘制、软件文档写作等几方面重点解析孟子GPT-Code-6.7B大模型使用效果。

文本转SQL能力

孟子GPT-Code-6.7B大模型具备强大的文本转SQL生成能力,不仅能准确解析语法,还能在发现输入错误时及时进行纠正。它深入理解SQL查询的语义,能够根据上下文和用户意图,智能优化查询方式,甚至在必要时为用户提供缺失信息,使查询更加精确。此外,该模型可以全面支持各类数据库的SQL语言,打破信息获取的壁垒,让数据处理更为高效。

我们从实例来看,“设计一个贷款申请数据库表,包括申请ID、贷款金额、贷款类型和申请时间字段。然后查询所有贷款金额大于100000的申请记录”,结果如下:澜舟科技通过生成式人工智能备案并重磅发布新版孟子GPT-金融模型和孟子GPT-Code模型模型准确无误完成了“贷款申请数据库表”的构建以及“贷款金额大于100000的申请记录”结果查询。

数据分析、图表绘制

孟子GPT-Code-6.7B大模型具备全面的数据处理和分析能力,涵盖数据清洗、特征工程、统计分析和预测建模等任务。其广泛的知识库和强大的推理能力使其能够应对多样化的数据类型和分析需求,帮助用户更好地理解数据集。此外,孟子GPT-Code-6.7B大模型还具备将复杂的数据转化为直观图像的能力,使用户能够更加直观地观测数据之间的关系和趋势。比如,让它“用Python写一个股票收益率分析的代码示例,并画出每日收益率折线图”,结果如图:澜舟科技通过生成式人工智能备案并重磅发布新版孟子GPT-金融模型和孟子GPT-Code模型

软件文档写作能力

孟子GPT-Code-6.7B大模型新增软件文档写作能力,以需求文档为例,通过对用户输入的深入分析,它能够精准洞察需求背后的意图,准确捕捉关键要素,并转化为详尽的开发文档。该模型考虑了各种边界条件和可能性,以确保文档的全面性和准确性。基于对大量代码和技术文档的训练,孟子GPT-Code-6.7B大模型对编程语言和技术概念有着深刻理解,它能够使用清晰、专业的语言描述软件需求和功能特性,并以规范化的格式编写文档。
以下图为例来看:澜舟科技通过生成式人工智能备案并重磅发布新版孟子GPT-金融模型和孟子GPT-Code模型|孟子GPT-Code-6.7B大模型体验链接:https://www.langboat.com/product/mchat?model=mengzi-gpt-code

结束语

本次发布了孟子GPT-金融-13B行业模型、孟子GPT-Code-6.7B模型,展示了澜舟大模型层次化的服务体系新的进展,可以更全面地满足企业客户,尤其是金融领域客户的业务需求。目前可以在澜舟官网上注册使用。

自成立以来,澜舟科技始终坚持从企业用户需求出发,以解决实际问题为首要任务。在研发孟子大模型的过程中,澜舟科技深入了解了各行业的需求和挑战,针对性地提升了模型的语言理解、生成能力和规模。通过与各行业的合作和实践,澜舟科技不断优化和改进模型,使其更加贴近实际应用场景。
展望未来,澜舟科技将继续保持技术创新和应用场景实践,不断推出更加优秀的大模型产品和服务。同时,澜舟科技也将积极与各行业合作,共同探索AI技术在各领域的最佳应用方案,推动各行业的数字化转型和发展。通过不断的技术创新和应用探索,相信澜舟科技孟子大模型将会在更多领域发挥其巨大的潜力,为人类带来更加美好的未来。澜舟科技通过生成式人工智能备案并重磅发布新版孟子GPT-金融模型和孟子GPT-Code模型

孟子大模型是由澜舟科技研发,面向生成场景的可控大语言模型,能够通过多轮的方式帮助用户完成特定场景中的多种工作任务。

体验网址:https://www.langboat.com/portal/mengzi-gpt

澜舟智会是一款基于孟子大模型面向企业用户的端到端会议内容分析平台产品,可以对用户上传的会议音频和视频进行文字转录和深度智能分析。

体验网址:https://www.langboat.com/portal/minutes

澜舟科技通过生成式人工智能备案并重磅发布新版孟子GPT-金融模型和孟子GPT-Code模型

澜舟科技官方网站

https://langboat.com

获奖与新闻

澜舟科技获批北京市专精特新中小企业

澜舟科技完成信通院“可信AI”评估

澜舟科技完成Pre-A+轮融资

HICOOL 2021 创业大赛一等奖 | 周明博士专访

最新合作携手新华智云 | 携手中国联通携手华夏基金 | 携手同花顺携手中文在线 携手数说故事 

技术专栏一览

辅助创作引擎 | 搜索引擎技术

自动摘要生成 | 机器翻译技术

孟子模型开源 | 孟子技术解读

认知智能平台 | 熊猫小说家

长期招贤纳士(含实习)

工程岗  |  研究算法岗  |  产品岗

孟子开源社区微信群澜舟科技通过生成式人工智能备案并重磅发布新版孟子GPT-金融模型和孟子GPT-Code模型

开源项目地址

https://s.langboat.com/mengzi

期待您的关注与加入 :)

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy