国内首个向量数据库标准发布!支持千亿级规模,腾讯云:推进大模型产业应用
本文来源:时代周报 作者:何珊珊
对于国产AI大模型而言,向量数据到底有何战略意义?
“未来的AGI时代,大模型是提供算力和调度的智能平台。向量数据库,就是智能化数据调度平台的中枢,这是我们对它的战略定位,对它的预期较高。”11月15日,腾讯云数据库副总经理兼向量数据库负责人罗云在接受时代周报记者采访时表示。
11月15日,国内首个向量数据库标准揭开面纱。在腾讯云向量数据库技术及产业峰会上,腾讯云宣布全面升级向量数据库多项核心性能,最高支持千亿级向量规模和500万QPS峰值能力,并与信通院一起联合50多家企业共同发布了国内首个向量数据库标准,推进向量数据库及大模型相关产业走向大规模应用。
今年以来AI大模型如火如荼,众多行业相关人士都曾坚定表示“大模型将改变千行百业”。时至今日,围绕大模型的讨论已进入“产业落地层面”。
据时代周报记者此前从投资侧了解,向量数据库被视为AI大模型继算力后的下一关键要素,也是多模态大模型向智能体进化的关键一环,对于推动大模型在垂直行业的落地具有重要作用。
向量数据库虽然是下一个风口,但腾讯并非追逐风口,而是早有布局。今年7月,腾讯云正式发布了AI原生(AI Native)向量数据库Tencent Cloud VectorDB。该数据库是国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库。
解决大模型应用难点
在本次峰会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示:“向量数据库不仅是支撑大模型的重要基础设施,也正在成为企业以数据驱动打造未来竞争力的重要一环。”
今年7月腾讯云发布向量数据库后,经过了多次迭代。据腾讯云方面介绍,在优化版的IVF索引支持下,已从最初的十亿向量规模扩展到了现在的千亿规模。同时,不断优化索引的压缩算法,让相同的内存可以存储5-10倍的数据。在智能化升级方面,腾讯云向量数据库集成Embedding功能,让用户无需关注向量生成过程,就可以实现快速处理数据,实现用自然语言和数据对话,助力企业加速拥抱AGI生态。
今年8月,深圳投控资本投资总监杨帆曾对时代周报记者表示,从行业脉络上看,下一个热点是多模态大模型,再下一个是向量数据库。杨帆认为,每一家有核心能力的大模型公司都应该有自己的向量数据库,如果没有向量数据库,大模型就是空中楼阁。将来要大模型系统、数据库时,如何保障客户数据安全性、私密性就会是个问题。
“只有具备了预训练多模态大模型和向量数据库等能力,才有可能做智能体。这里面任何一项不具备,都演化不到智能体。”杨帆表示。
据时代周报记者了解,向量数据库是一种非结构性数据库,具有速度快、存储大、可随时扩容三大特性,而之前的数据库都是结构化数据库。
关于向量数据库的搭建和迭代,对腾讯未来与企业合作和数据安全性保障上的意义,罗云对时代周报记者解释道:“现在业内推进大模型应用的难点是,企业有许多数据非常注重保密性,无法随意调用。现在我们可以通过向量数据库把用户的私域数据变成向量存储起来,只在一次交互的过程中携带部分数据给大模型进行推理。好处是向量数据库可以部署在客户的CRM上或者私人机房里,大模型只能在交互的过程中拿到客户数据,可以提高用户隐私数据安全方面的保障。”
图源:腾讯
加速产业落地
本次峰会上,国内首个向量数据库技术标准《向量数据库技术要求》正式发布。
据了解,这份由腾讯云联和信通院等超50家企业联合编制的标准,将为向量数据库技术和产业的有序发展提供专业规范。为推动大模型产业更快创新发展,腾讯云还与硬件厂商、大模型厂商、行业代表等联合成立了“AGI技术生态联盟”。
为了加速向量数据库在企业的大规模应用,腾讯云还推出了国内首个端到端的向量数据库解决方案,通过文本智能化分割、选择向量化模型、帮助客户建立索引,再经智能化排序实现端到端的数据接入体验。将端到端召回率提高30%,缩短数据接入AI的时间。
腾讯云副总裁陈平表示:“腾讯云积极参与向量数据库相关标准制定,并通过搭建AGI技术生态联盟,与上下游伙伴一道,加强产业合作,打造更多的行业解决方案,加速大模型落地。”
目前腾讯云向量数据库已经累积服务了腾讯内部40多个业务,日请求量达1600亿次,服务了包括博世、销售易、搜狐、好未来、链家等在内的超过1000家外部客户。例如,在SaaS领域,腾讯帮助企业客户快速构建私域知识库、智能客服系统;在电商行业,使用向量数据库来提升推荐、搜索、广告业务的推荐效果;在出行行业,使用向量数据库来加速自动驾驶模型训练,此外,在教育行业以及文创等行业也有广泛应用。
对于未来大模型在产业上的应用落地趋势,此前商汤研究院的田丰院长对时代周报记者分析道,参照Garnter技术成熟度曲线,AI大模型已经从“创新启动期”进入“期望膨胀期”,在天使投资进入后,将在“多模态基础模型”(例:GPT-4)、“领域大模型工具软件”(例:Runway)、“垂直行业大模型解决方案”(例:BloombergGPT)三个方面,快速试错,并在下一个阶段校准产业价值型产品、淘汰非刚需性技术。
关于向量数据库未来对大模型行业的影响,罗云表示:“未来大模型提供计算能力,而向量数据库把人类世界所有的数据流转调用起来,作为枢纽搭建数据平台,通过数据平台加上计算平台,走向未来的AGI时代。”
最近更新
-
上市游企TOP50科创力榜:去年研发投入超千亿,最高占比近7成、最低不足3%
11:36
-
精功系败落,原绍兴首富出局,国资股东接盘超3亿股绍兴银行
昨天 21:02
-
监管能见度丨昆仑新材创业板IPO被深交所终止,营收两年暴增10倍也难掩研发硬伤
昨天 19:01
-
工行老将王都富接棒,工银安盛新董事长落定,银保转型何往
昨天 18:36
- 盛屯矿业被立案股价跌停,受损投资者可免费报名索赔
- 每辆车毛利润减少1万,理想汽车越卖越便宜
- 【港股收评】三大股指齐升!黄金股爆发,航空股等走强
- 港股还有多大的上涨空间?
- “618”取消预售,李佳琦直播间更新“减负”策略
- 佳云科技被立案股价大跌超13%,投资者可报名挽回损失
- 佳云科技收到深交所年报问询函,被立案股民可索赔
- 港股大反攻,主题基金大幅“回血”,后市怎么走?
- 明天新闻发布会,看看有啥政策利好
- 5.21号,这些板块有利好
专栏推荐
-
研选
浓缩机构研究精华,提前捕捉市场风口
2041人已购
¥258.00/月
-
尾盘擒牛之如何选股?
学完这些方法,告别选股难!
117人已购
¥288.00/月
-
财报拆解
知识点解读+实战案例,帮你5小时学会看财报
73人已购
¥19.90/月
-
每周一股
每周日定期更新【每周一股】,为广大的投资者精选下周短线个股!
344人已购
¥588.00/月
推荐阅读
- 平安担保江西分公司:科技创新赋能力挺制造业“强筋健骨”
- 理想汽车绩后大跌近20%,王兴、李铁“先知先觉”逃顶,港股通消费ETF(513960)跌超3%
- 涉及“专网通信案”被罚,这只ST股复牌暴跌20%!HBM供不应求,巨头公司产能售罄!高增长潜力概念股稀缺,仅7只
- 连续上涨的港股终见回调,恒生医疗ETF(513060)跌超3%,京东健康一季度利润同比降35%,股价今日跌超7%
- 天猫618首日业绩爆发,这类商品销售额惊人!机构密集看好行业需求修复,多股获外资大手笔抢筹
- 情怀不灭,212复兴引领越野文化升级
- 海底捞创始人张勇夫妇谋求营收新增长点,个人财富波动显著
- 亿航智能业绩向好,股价却向下“俯冲”?
- 伊利股份大手笔回购计划:拟斥资10亿至20亿回购公司股份
- 小牛电动Q1财报:后“新国标”时代销量复苏,海外市场成增长助力丨直击业绩会
- 美股新股解读|收入、净利润同比下滑,迎接正业生物(ZYBT.US)的是风险还是机遇?
- 5.21午评|忽略噪音,坚定信心!