elasticsearch人工智能(2025年的OpenSearch:远不止一个Elasticsearch分叉)

elasticsearch人工智能(2025年的OpenSearch:远不止一个Elasticsearch分叉)
2025年的OpenSearch:远不止一个Elasticsearch分叉

  开源从未如此流行。它也从未像现在这更有争议。

  供应商为将开源最能使用的云服务转化为易于使用的云服务的公司提供了数千亿美元,供应商已经激烈地争夺企业资金。这导致开发开源软件的公司以及想要打包和销售开源软件的云公司进行了一连连的许可更改。但有趣的事情正在发生:这些分叉可能以克隆战争开始,但它们本身是越来越创新的项目。我最近写了一篇关于OpenTofu与Terraform的步伐,但本周在阿姆斯特丹举办大型社区活动的OpenSearch是一个更大的成功故事。

  OpenSearch诞生于Elastic 2021年许可证变更的火焰,在最初的几年里稳定并证明它可以(并且应该)继续存在。在过去的一年里,OpenSearch积极地建立了自己的身份,作为企业搜索中真正独立和创新的力量,它正在迅速发展,远不止是Elasticsearch的相似。

  超越分叉

  要了解OpenSearch最近的路径,快速倒带是必不可少的。2021年初,Elastic放弃了Apache许可证(ALv2),转而使用新的Elasticsearch和Kibana版本,选择了服务器端公共许可证(SSPL)和Elastic许可证(ELv2)。目标?防止AWS和其他云供应商在不让Elastic被削减的情况下提供Elasticsearch作为服务。AWS的托管服务严重依赖ALv2代码库,反应迅速,分叉了Elasticsearch 7.10.2和Kibana 7.10.2。他们剥离了Elastic的专有代码和遥测,在ALv2下启动了OpenSearch项目。这是一个大胆的举动,但它留下了很多不确定性:AWS在运行社区驱动的项目方面没有专业知识,在管理自己的开源项目(如Firecracker)方面只有一点经验。

  2023年,我注意到OpenSearch的一些早期成功,因为它扩大了社区并赢得了一些早期客户。但正是过去一年的事件表明,AWS在学习如何以大方式为开源做出贡献方面取得了多大的努力,使OpenSearch成为企业搜索的重要竞争者。

  尽管大多数开源项目的贡献者池非常有限,并且通常是单个开发人员(或单个公司的手工),但当项目位于中立基础内时,更容易吸引志愿者贡献者。因此,AWS在2024年底将该项目转移到Linux基金会,成立了OpenSearch软件基金会(OSSF)时,展示了它对OpenSearch开源成功的认真程度。这不仅仅是管理员洗牌;它是战略性的。将项目放置在中立的基础上,直接解决了对AWS控制项目的担忧。突然间,技术指导委员会(TSC)夸耀了来自SAP、Uber、Oracle、Bytedance等的代表。此外,到2025年初,OpenSearch现在可以声称超过1400个独特的贡献者(超过350个活跃),数十个组织的数百个维护者,以及跨越100多个GitHub存储库的活动。至关重要的是,来自AWS以外的贡献和维护者的百分比大幅增加,这预示着实现真正多样化的进展。

  对于AWS来说,其领导原则几乎要求对客户结果(“交付结果”等)的控制,这是其经营方式的革命性变化。

  一直在变得更好

  显然,OpenSearch正走在正确的道路上。随着治理的巩固,OpenSearch在公共路线图的指导下,追求积极的发展,超越其根源,应对现代数据挑战,特别是在人工智能/矢量搜索和可观察性方面。OpenSearch已经大大超越了Elasticsearch的兼容性。在用户需求的驱动下,OpenSearch增加了矢量相似性搜索、结合关键字和语义方法的混合搜索以及内置的神经搜索功能。仅在2024年,OpenSearch就取得了重大进展——增加了与Facebook的FAISS、SIMD硬件加速和向量量化的集成,用于高性能语义搜索。

  性能和可扩展性的提高也是巨大的。由于广泛的优化,查询速度显著提高(比早期版本快六倍)。新功能,如分段复制,将数据摄取吞吐量提高了约25%。此外,远程支持存储现在能够将具有成本效益的索引直接索引到云对象存储服务中,这对处理PB级数据集的企业至关重要。

  这不是一个希望追赶的社区。这是对领导力的战略竞标。

  编写好代码是一回事。说服企业使用它是另一回事。在这个领域,越来越多的证据表明,OpenSearch正在获得企业基础。仅仅衡量使用(不担心它是否是付费采用),到2023年底,OpenSearch的累计下载量已超过3亿,这清楚地表明了主流采用。就AWS而言,它吹捧“数以万计”的客户(这可能是真的,但这个数字包括旧版本的Elasticsearch用户)。虽然很难找到采用OpenSearch的大型企业的公开例子,但过去和未来的OpenSearchCon活动揭示了LINE、Coursera和其他重要用户(尽管大多数演讲仍然由AWS员工进行)。招聘广告显示,富达投资、华纳兄弟等是OpenSearch用户。此外,Linux基金会的一份报告发现,46%的受访用户将OpenSearch作为托管服务运行,这表明云吸收率很高。对更好的互操作性的高需求(87%)也表明用户将其视为更广泛的堆栈的一部分。

  Elasticsearch的长阴影

  尽管取得了进步,但OpenSearch面临着挑战,主要是与Elasticsearch的不断比较。例如,Elastic经常声称性能优势(快40%到140%)。然而,2025年3月比较OpenSearch 2.17.1和Elasticsearch 8.15.4的Trail of Bits基准测试发现,OpenSearch在“Big 5”工作负载上总体上更快,在Vectorsearch(默认引擎)中速度适中,尽管结果各不相同。基准是臭名昭著的不可靠的仪表;您的里程可能会有所不同。

elasticsearch人工智能(2025年的OpenSearch:远不止一个Elasticsearch分叉)

  OpenSearch也不能声称自己是Elasticsearch的开源替代品。2024年底,Elastic与SSPL和ELv2一起增加了AGPLv3许可证选项。怀疑论者认为,这种回归开源是对OpenSearch势头的愤世嫉俗的回应,但在我与Elastic联合创始人Shay Banon的谈话中,该公司一直想回到OSI批准的许可证:“我个人一直想回到开源,即使我们更改了许可证。我们希望AWS能叉开,并在足够多的时间过去时让我们回去。”不管动机是什么,Elasticsearch现在和OpenSearch一样是开源的。

  这种比较不再真正重要了。事实证明,OpenSearch不仅仅是AWS对供应链风险的本能反应。OpenSearch正在构建自己的身份,专注于下一代工作负载。尽管如此,OpenSearch的最大挑战仍然是将其开放治理和允许许可转换为一个生态系统的过程,该生态系统可以构建卓越的搜索,以取代Elasticsearch或其他竞争对手。还有很长的路要走,但它在过去几年,特别是2024年的进步,表明OpenSearch将在这里停留——并获胜。

来源:https://www.infoworld.com/article/3971473/opensearch-in-2025-much-more-than-an-elasticsearch-fork.html

文章版权声明:除非注明,否则均为边学边练网络文章,版权归原作者所有