支持5000万tokens!百川发布全新API产品,解决99%定制化需求

1,203次阅读
没有评论

支持5000万tokens!百川发布全新API产品,解决99%定制化需求

半年 toB 商业化探索后,百川智能给出了针对大量定制化需求的产品解决方案。12 月 19 日,百川智能发布基于搜索增强的 Baichuan2-Turbo 系列 API,包含 Baichuan2-Turbo-192K 及 Baichuan2-Turbo。在支持 192K 上下文窗口的基础上,增加了搜索增强知识库的能力。在百川智能创始人& CEO 王小川看来,「搜索增强」是大模型落地应用的关键,能够解决 99% 知识库定制化的需求。支持5000万tokens!百川发布全新API产品,解决99%定制化需求

01

搜索增强

大模型的「外挂硬盘」

大模型落地时存在一些问题:幻觉,回答不准确;时效性差,知识无法及时更新;专业知识不足,垂直落地门槛高等。百川智能给出的解决方案是:长文本大模型+搜索增强,让模型能获取互联网实时信息,也能接入企业完整知识库。「大模型是新时代的计算机」是业内常用的比喻,上下文窗口是模型能力的内存,而王小川认为,「搜索增强」是大模型的「硬盘」,将互联网实时信息和企业知识库像硬盘一样即插即用,「外挂在计算机上」。

支持5000万tokens!百川发布全新API产品,解决99%定制化需求

目前业内已经有一些基于搜索的解决方案。学术界提出知识注入、知识研究的新研究方向,Meta Cove、Google LAMDA、OpenAI WebGPT 等都是类似理念的产物。RAG(检索增强)成为一个热门方向,生态包括 Langchain、LlamaIndex 等热门项目。OpenAI 在 11 月的开发者大会上,也发布了自研的 RAG 产品 Retrieval 检索工具。在大模型无法直接落地到各种场景时,搜索能力的加入补完了大模型落地的完整技术栈。在此之前,百川发布了向量数据库,也推出了 192k 的长文本模型。在这两者的基础上,百川实现了稀疏检索和向量检索并行,以及搜索系统与大模型的对齐

支持5000万tokens!百川发布全新API产品,解决99%定制化需求

经过百川智能算法团队的测试,搜索增强+长文本+大模型的方案,能够接入 5000 万 tokens 的数据集,比模型本身的 context window 提升「两个数量级」,实现 95% 精度的回答。王小川表示,搜索增强知识库能够替代绝大部分企业个性化微调,解决 99% 企业知识库的定制化需求。

02

真·大海捞针

支持检索 1 亿汉字

稀疏检索+向量检索

在向量数据库和长文本窗口外,百川智能发挥了自己过往做搜索的经验,对向量检索进行了改进和增强,在向量检索之外增加了搜索引擎里常用到的稀疏检索方式。「稀疏检索是原来我们做搜索引擎里用到的基于符号的搜索方式。向量检索语义上会更加贴近,但其实会有很多漂移和漏召,而稀疏检索对严格的语义,漂移也好,效率也好,会比向量检索高很多,所以这两个系统各有优势,两个并行起来怎么能组装在一块,这是我们在做的工作。」王小川解释道。两种检索方式的组合经过调优后,将传统向量检索可用率从 80% 提到 95%,把 RAG 检索系统的能力带到了全新的高度。

支持5000万tokens!百川发布全新API产品,解决99%定制化需求

搜索与模型的对齐

王小川提到,以前做搜索时,用户提问更多是关键词或短句,而今天大模型的提问,更多是更复杂的完整问题,「这种问题通过稀疏检索和向量检索跟搜索系统对接,是一个新的技术攻克点。」百川通过 prompt2query、doc2query 对齐用户需求,做到搜索系统与模型本身的对齐。

真·大海捞针

「大海捞针」是近期非常热门的,针对大模型长文本能力的一个测试。百川大模型在面对 192k 以内的请求时,实现了 100% 回答精度。针对 192k token 以上的文档数据,百川在测试中,面对文本总量提升 250 倍,达到 5000 万 tokens,近 1 亿字的测试集,用稀疏检索+向量检索的方式,可以实现 95% 以上的回答精度。「我们管这个测试叫『真·大海捞针』。」王小川说。支持5000万tokens!百川发布全新API产品,解决99%定制化需求

03

避免项目化

用 API 产品解决定制化需求

王小川表示,搜索增强最大的目的不是解决幻觉问题,而是解决「可定制化」问题。前搜狗 CMO,目前担任公司联创、联席总裁的洪涛在 8 月加入百川智能,负责商业化。在商业化线索沟通中,洪涛发现,前期很多客户「想了解大模型,很多人来问大模型到底是什么,能干什么」,而最近两个月,客户的问题越来越具体,「已经有一些场景感受到能用大模型了,但是解决的时候比较痛苦,最基础的是微调,狠一点的 SFT、Post-Training 都会提,但这些其实很『重』。」通过 SFT、Post-Training 的方式训练行业模型,需要企业具备一定的大模型技术人才,需要一定量的算力和时间成本,并且一旦出现数据更新,或者基座模型升级的情况,都需要重新训练。核心还是成本,客户成本高,项目利润低。「相对能盈利的 toB 公司,卖的大多是『产品』,而大多数定制化是『项目』,」洪涛说,搜索增强的完整技术栈,目的就是让 API 外挂企业知识库实现「定制化」,是一款产品,可配置、可调整。他举了 Oracle 的例子,各种产品的组合提供解决方案,而不是单独开发一个数据库。「我们也希望在为私有化客户做定制化的时候,用产品组合的方式来做,而不是用全都重新开发一遍的方式做。」洪涛对 Founder Park 说道。王小川进一步阐释称,所谓定制化,customize,更准确地说是个性化,客户天生有「个性化」的需求。百川希望避免的,是「项目化」,「用产品化取代项目化,是指产品具有定制化的能力,能够实现企业的低成本定制。企业可以把知识库对接,避免做成项目,客户成本很高。」
如果你关注大模型领域,欢迎扫码加入我们的大模型交流群,来一起探讨大模型时代的共识和认知,跟上大模型时代的这股浪潮。支持5000万tokens!百川发布全新API产品,解决99%定制化需求

更多阅读从100多个GPTs里,探究OpenAI究竟想要什么,又做了什么
估值超5亿美元,体验碾压Bard、Bing,AI搜索引擎Perplexity的想象力在哪里?
Meta、Midjourney、Adobe、DALL·E:四大巨头的 AI 绘图模型综合评测
时代周刊:为什么 Sam Altman 是 2023 年度 CEO?
MindOS:站在AGI风口,创业两年的教训与思考
专访Pika Labs创始人:视频模型技术路线尚未确定,明年会迎来AI视频的GPT时刻
转载原创文章请添加微信:geekparker

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 12 月
 123
45678910
11121314151617
18192021222324
25262728293031
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这 西风 2025-12-11 15:...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地

预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地

预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地 henry 2025-12-11 10:27:...
Meta公开抄阿里Qwen作业,还闭源了…

Meta公开抄阿里Qwen作业,还闭源了…

Meta公开抄阿里Qwen作业,还闭源了… Jay 2025-12-11 11:48:25 来源:量子位 Ja...
MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这 西风 2025-12-11 15:...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...