快速增长的嵌入式数据库公司Chroma宣布获得1800万美元的种子轮融资。该公司的开源工具旨在为不同的LLM应用程序添加状态和内存,从而减少幻觉并增加事实性。随着不同的LLMOps工具不断融合,这将是一个令人感兴趣的发展趋势。
什么是Chroma?
Chroma是AI原生开源嵌入数据库。使用嵌入,Chroma允许开发人员将状态和内存添加到其启用人工智能的应用程序中。
开发人员使用Chroma为LLM提供有关其数据、事实、工具的可插拔知识,并防止幻觉。许多开发人员表示,他们想要“ChatGPT,但为了我的数据”-Chroma通过基于嵌入的文档检索提供了“为了我的数据”的桥梁。
Chroma“包括电池”,其中包含开发人员存储、嵌入和查询数据所需的一切,内置了过滤等强大功能,自动集群和查询相关性等更多功能即将推出。
令人惊讶的是,自发布以来,开发人员在过去的5周里以各种方式选择Chroma,在过去的一个月里超过了35000个python下载量。
我们为什么要建造Chroma?
Chroma基于以下原则:模型可以通过其潜在空间的可解释性来理解,当我们进行实验时,我们需要一个功能强大且易于使用的开源矢量数据库。我们评估了现有产品,但发现它们难以使用,并且从根本上为不同的用例(网络规模语义搜索)构建。我们为自己建造了Chroma,因为它是我们需要和想要的产品。
Anton和我深厚的可解释性经验一直延续到今天;我们相信你不能只给应用程序开发人员一个“矢量数据库”——你必须支持从实验到扩展的整个生命周期。
为什么开源?
我们致力于构建开源软件,因为我们相信人类的繁荣,通过强大、安全和一致的人工智能系统的民主化,人类将得到释放。这些工具需要提供给刚刚从ML开始的新开发人员以及将ML扩展到数百万(和数十亿)用户的组织。开源是关于扩大可能的视野。
接下来是什么?
在短期内,我们正在努力完成社区帮助我们优先考虑的几个项目:
- 查询相关性等新功能将帮助开发人员了解检索到的嵌入是否与他们的查询相关。
- 我们正在开发一个开源分布式系统,以替换客户端/服务器Chroma的当前数据库。这将使我们能够提供托管产品,提供向上和向下扩展到零的无服务器存储和检索功能。这将以免费的技术预览推出,随后将提供公平的价格。
我们也特别感谢整个Chroma社区。长期来看,Chroma和Chroma社区将帮助定义如何构建这一新一波人工智能软件。