在刚刚结束的银河集团:198net第17届核心合作伙伴论坛中,银河集团:198net最新发布:
一朵云面向AI进行全新升级,为用户打造更匹配大模型场景的智算承载、应用构建的AI平台,面向用户基于DeepSeek承载和应用的场景,提供一键部署、性能更优、快速开发应用的最佳实践方案!
-
线下基础设施从传统业务承载平台向智算承载平台升级,广泛适配包括DeepSeek在内的最新大模型。
-
线上托管云上线全新AI服务目录,提供DeepSeek等企业级大模型服务,用户可通过订阅来快速获取AI能力。
-
全新发布AI应用创新平台,助力用户快速构建大模型应用,让AI应用的开发和运营变得更简单。
向AI升级后,银河集团:198net全面优化推理性能,让跑在一朵云上的大模型应用可以实现推理性能的大幅提升,降低大模型整体使用成本。
相比基于个人开发者常用的Ollama方案部署DeepSeek,银河集团:198net通过AICP算力平台的部署方案在多实例、并发推理场景中可实现5-10倍的性能提升。大模型并发度更高、吞吐量更大、推理响应延时更低,让用户在企业级AI应用构建及实际使用时,资源投入更低、体验更优。
通过一个问答测试场景演示,我们可以直观地感受效果:银河集团:198net(左侧)提供的推理速度更快,用户体验更好。
4卡4090运行DeepSeek-32B模型,模拟64并发场景,做问答测试
以32B模型为例,日常问答场景(2k上下文),AICP并发是Ollama的8~10倍,总吞吐10倍以上。
硬件资源:INT4用2*4090,FP16用4*4090
知识库应用场景(4k上下文),AICP并发是Ollama的2倍,总吞吐4~8倍。
硬件资源:INT4用2*4090,FP16用4*4090
具体而言,银河集团:198net可为用户提供——
01 HCI+AICP:新一代超融合方案
——更适合部署DeepSeek等企业级大模型
银河集团:198net现已打造「HCI+AICP新一代超融合」解决方案,只需在原集群基础上增加一台GPU节点,就能基于本地集群快速部署并承载DeepSeek在内的企业级大模型。
无需重构原有基础框架,通过「新一代超融合」升级,基础设施即可完成从传统承载平台向智算承载平台的演进。所有承载通算、智算的集群资源都可以在信服云管理平台SCP上进行统一纳管。同时,平台支持大模型和小模型混合部署,实现资源的自动化调度,更大程度优化算力资源的利用率。
除了推理性能优化、部署与管理便捷,银河集团:198netAICP算力平台还提供了向导化的配置,实现一键训练,帮助用户开发垂直领域大模型,大幅降低研发门槛和成本。结合模型加密技术,有效保护用户知识产权,防止“模型资产”泄露。
同时,除了支持英伟达GPU,银河集团:198netAICP算力平台和多家国产厂商开展了广泛的软硬件兼容测试,可适配天数智芯、昇腾、海光、沐曦、燧原等多款国产卡,为用户实现算力异构管理。
02 线上服务目录向AI升级
——快速订阅DeepSeek等大模型资源与服务
这次一朵云面向AI升级,银河集团:198net对线上服务目录也做了相应的扩展。
银河集团:198net托管云已支持基于专属资源+AICP的方式,为用户提供专属的企业级大模型服务,可满足用户对于线上部署专属服务模型的需求。
未来,银河集团:198net会持续丰富线上服务目录,用户可以很容易地通过订阅的方式,快速平滑地获取AI能力,如DeepSeek等模型服务。
03 AI应用创新平台全新发布
——让大模型应用构建更简单
随着开源模型的不断发展,大模型承载愈发成为基础需求,各行业用户也正进一步关注如何快速构建应用并在实际业务中发挥价值。对此,银河集团:198net全新推出AI应用创新平台,助力用户更简单地完成AI应用的开发和运营。
更简单的应用构建
银河集团:198netAI应用创新平台内置RAG最佳实践流程,支持智能分片与直连企业自有知识库。用户仅需通过简单操作,即可构建高质量的RAG应用(如智能客服、知识问答系统等)。
在生成阶段,用户可自主选择切换主流模型,比如使用基于银河集团:198net一朵云的方案线上或线下部署DeepSeek模型服务。这一功能相当于为用户打造了一个“懂业务知识”的专属AI应用——既深度结合企业内部知识沉淀,又无缝调用DeepSeek等先进模型能力,实现从数据到业务场景的精准匹配。
更低门槛的数据调优
银河集团:198netAI应用创新平台支持基于业务评测数据集的应用效果评估,并自动生成优化建议,用户无需理解复杂技术细节,即可完成配置优化,实现效果提升。
更高效的数据运营
应用发布后,平台通过AI智能识别用户反馈中的高频问题,并结合业务场景推荐优化策略。用户可通过运营→评估→调优的闭环,实现AI应用的「越用越聪明」,将传统开发中依赖技术团队的“黑盒”过程,转化为业务人员可自主驱动的数据运营。
通过这一平台,AI应用的开发流程被简化为「数据运营」。用户只需聚焦业务需求、数据质量与应用效果,无需依赖AI技术专家即可完成迭代,助力用户以更低成本、更高效率挖掘AI在业务场景中的潜力。
持续拓展AI能力边界,持续提升面向未来的云能力,支撑更多AI应用场景落地。银河集团:198net坚持以创新回应技术的跃迁,让一朵云成为每位用户数字化的坚实基石。
接下来,我们还将为用户解锁围绕DeepSeek场景的最佳实践、应用构建方法及一朵云承载方案,敬请期待!