欢迎来到腾博tengbo9888官网,腾博官网入口网址,腾博国际官网新网站功能天地科技(北京)有限公司网站!
咨询电话:

13810889201

欢迎来到腾博tengbo9888官网,腾博官网入口网址,腾博国际官网新网站功能天地科技(北京)有限公司网站!
咨询电话:

13810889201

直击云栖阿里云再甩王炸:模型到云基础设施全面升级

更新时间:2024-10-28      点击次数:

  云计算本身就是灵活、低门槛、技术普惠理念下的产物★◆。AI 时代,有了底层技术架构革新去探索巨量 AI 算力新解法、开源自研大模型以追求 AI 技术的极致前沿水平◆★◆■,阿里云就有了成为中国大模型的公共 AI 算力底座的底气。

  今天大会上,阿里云百炼平台上的三款通义千问主力模型再次降价,Qwen-Turbo 价格直降 85%■★■■◆◆,低至百万 tokens 0.3 元■★,Qwen-Plus 和 Qwen-Max 分别再降价 80%和 50%。自首次宣布降价后,阿里云百炼付费客户数较上一个季度增长超过 200%,大批企业和开发者放弃私有化部署◆★,选择直接在百炼上调用各类 AI 大模型,中国一汽★◆、联想、微博、携程★■◆■◆、喜马拉雅、三得利(中国)等 30 多万企业客户已经接入通义大模型。

  重要的趋势之下★★,全球科技巨头纷纷加码 AI 大模型技术投入,在今天的 2024 云栖大会上◆■■,阿里云通义旗舰模型 Qwen-Max 全方位升级,性能接近 GPT-4o★★◆■★;通义千问推出新一代开源模型 Qwen2★◆.5,Qwen2.5 全系列涵盖多个尺寸的大语言模型◆◆、多模态模型★◆◆■★★、数学模型和代码模型■★◆■★,每个尺寸都有基础版本★◆◆★、指令跟随版本、量化版本■★◆■■◆,总计上架 100 多个模型■★★■◆,刷新业界纪录■■◆★。

  韦德雕像由Rotblatt Amrany设计 该工作室还曾创作乔丹科比雕像!

  我们看到,AI 计算范式正在从图灵、冯·诺伊曼计算范式转为神经网络计算范式,以 GPU 为主的 AI 算力是目前 AI 系统计算的核心。今年云栖大会,阿里云从自研磐久 AI Infra 服务器、云基础设施处理器 CIPU,GPU 容器算力★◆★◆■◆,自研 HPN7★★.0 高性能网络,自研智算 CPFS 文件存储系统,AI 大模型工程平台 PAI,全链路提升 AI 系统性能。

  另外◆■★■■★,通义千问新一代开源模型 Qwen2◆◆★◆.5 发布,旗舰模型 Qwen2★◆.5-72B 性能超越 Llama 405B,再登全球开源大模型王座★■■★★。Qwen2◆★■◆★★.5 全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本■◆◆、量化版本■■,总计上架 100 多个模型■◆◆◆,刷新业界纪录。

  过去两年,从生成式 AI 火爆出圈到 AI 大模型在各行业落地应用,CSDN 看到★◆■■,大模型正在掀起一场智能化革命,带来计算、开发◆★、交互三大范式全面升级和转换,本次 AI 技术浪潮■◆◆◆■,可能进一步让我们迎来科技变革周期★◆◆◆■,而且比移动与云计算变革更加剧烈。这与 IT 云化、全行业数字化之后 AI 引发的云计算第三次浪潮不谋而合。

  2024 年 9 月中旬,通义千问开源模型累计下载量已经突破 4000 万,通义原生模型和衍生模型总数超过 5 万个◆■,成为仅次于 Llama 的世界级模型群。

  在网络层面★■◆◆■★,针对需要高带宽的 AI 推理在传统数据中心三层网络架构中遭遇负载不均衡的问题◆■◆◆■■,今年云栖大会阿里云推出自研高性能网络 HPN 7.0◆■★■■◆。HPN 网络系统论文于 2024 年收录顶会 SIGCOMM,成为首篇智算架构论文★■■■◆,HPN 7◆◆■★◆★.0 设计了“双上联+多轨+双平面”的网络架构,被认为是继谷歌 Jupiter 经典网络之后的 AI 网络架构新范式■★★◆。以 HPN 7◆■■★◆.0 构建的高性能、高稳定 AIinfra 网络,支持 3.2TRDMA 网络带宽,模型训练性能端到端提升 10%,集合通信性能提升十余倍。除了 HPN,阿里云还提出端网融合的可预期网络技术体系■■★◆◆◆、率先实践 RDMA 低延时网络◆■★,阿里巴巴还曾获评权威机构 AMiner 全球十大最具影响力的网络研究机构■★★◆■★。

  计算存储网络之上,还有数据/算力/AI 资产管理、开发★■、训练、推理的大模型工程化平台 PAI,通过针对 AI 各层全栈优化的 AI Infra,阿里云灵骏集群提供高效的一体化 AI 算力,万卡规模性能线TB/s■◆,万卡规模下网络带宽利用率超过 99%,可支持单集群十万卡级别 AI 算力规模★★★■★■。技术创新也得到了行业权威认可■★★◆★,Gartner 最近刚刚发布了针对 AI 大模型和全流程服务的 2024 年全球云 AI 开发者服务魔力象限,阿里云成为唯一进入挑战者象限的中国厂商★◆■。

  阿里云自研 AI 服务器磐久系列■◆★■,推出针对 AI 深度优化版本 G 系列(现场展示了磐久 AI Infra1◆★.0、2.0 服务器),可以支持国内外多种 GPU 与异构芯片、单机可实现 16 颗 GPU 高速 Scale up 互连,支持最高 1.5TB 共享显存,提供最高 3.2Tbps 的 Scale-Out 网络带宽。除了硬件规格升级◆◆◆,磐久面向高性能计算的可靠性设计★◆■◆■◆,采用超钛金电源实现能效超 97%,基于 AI 算法的 GPU 故障预测准确率达 92%。另外,阿里云自研云基础设施处理器 CIPU2.0 全面打通阿里云 AI Infra,通过 VPC、eRDMA 提供高性能虚拟网络能力,并全量接入 EBS、EED◆■、CPFS、DFS 等高性能 AI 存储能力;通过存储和网络数据 E2E 加密◆★、统一 TPM 硬件可信根等技术确保数据全生命周期安全。通过软硬一体协同优化,CIPU2■◆■◆.0 最终可以实现 400Gbps 的高吞吐硬件数据加速架构,将整机稳定性提升 20%。

  消息称 OPPO Find N5 折叠屏工程机搭载骁龙 8 至尊版处理器

  普京最新发声:如何执行与朝鲜的条约是俄罗斯自己的事,还谈到乌克兰危机★◆、中东局势...◆◆◆■★◆.■★■■■★..

  面对 AI 海量数据存储管理挑战,阿里云存储服务全面升级★★,AI 训练场景通过采用对象存储服务(OSS)作为统一的数据湖底座,并结合文件存储 CPFS 数据流动◆◆★◆■◆,通过冷热数据分离进行生命周期管理◆◆◆★■★,实现端到端全链路性能提升,数据吞吐 20TB/s,为 AI 智算提供指数级扩展存储能力■★◆;另外阿里云 Tablestore 表格存储的向量检索技术■★◆◆★◆,推出了 OSS 索引服务-语义检索,适用于大规模多模态数据集的管理。

  阿里巴巴集团 CEO、阿里云智能集团董事长兼 CEO 吴泳铭在 2024 云栖大会上提到★★,AI 发展的速度超过任何历史时期,但现在也仅仅是 AGI 变革早期,生成式 AI 最大的想象力,绝不是在手机屏幕上做一两个新的超级 app,而是接管数字世界,改变物理世界。,开源开放的技术生态,成为中国公共 AI 算力底座★■★■,与全行业共同迎接◆◆★◆★★“图灵时刻★★”。

  联想 moto razr 50“白色恋人限定版★◆★■”手机 10 月 31 日开售

  大会现场,通义大模型迎来了年度重磅发布。首先是通义旗舰模型 Qwen-Max 全方位升级,性能接近 GPT-4o。通义官网和通义 APP 的后台模型均已切换为 Qwen-Max■★■★■★,继续免费为所有用户提供服务◆◆◆■。用户也可通过阿里云百炼平台调用 Qwen-Max 的 API。

  对于更前沿的 AGI 通用人工智能、具身机器人等话题,云栖大会上 AI 前沿技术研究学者预测 L3 级别的 AGI 将在未来 18 个月内实现,甚至集成 AI 各模块后 L4 级别的通用人工智能也将加速产生。

  除了高密度 AI 服务器硬件升级,在 2023 年 Gartner 容器管理魔力象限进入领导者象限的阿里云,在今天会上宣布容器计算服务 ACS 重磅升级■■◆★■★,以 0.5vCPU◆◆★◆■★、1GiB 步长递进,实现更柔性的秒级自动热变配;每分钟可弹至 10000 个 pod,并推出按天承诺消费的节省计划,综合算力成本最高可降 55%。面向 AI■◆■,ACS 首次推出 GPU 容器算力,用户可以容器化去使用 GPU 算力■◆◆★,通过拓扑感知调度,实现计算亲和度和性能的提升★◆;容器服务 ACK 再升级★■,大模型应用冷启动延迟降低 85%◆■★★★◆,容器网络吞吐增加 30%,弹性扩容效率提升 25%,并可提供 15000 个超大规模节点支持。

  通义万相全面升级◆★★,并发布全新视频生成模型■★■◆★,可生成影视级高清视频,可应用于影视创作★■★、动画设计◆★★◆■、广告设计等领域。即日起,所有用户可通过通义 APP 及通义万相官网免费体验。

  现在,中国一半大模型公司跑在阿里云上,百川智能、智谱 AI、零一万物、vivo、复旦大学等大批头部企业及机构均在阿里云上训练大模型;中国众多头部主流大模型都已通过阿里云对外提供 API 服务◆◆★,包括通义系列、Baichuan 系列★■◆■、智谱 AI ChatGLM 系列等◆■★■◆。

  以上,我们还只是研究讨论了 AI 基础设施、大模型开源与生态■■★◆,模型之上则是千行百业的 AI 应用百花齐放。从今年云栖大会的展览部分也能看出,三个场馆中 AI 底层和前沿技术的展商有 17 家,AI 算力计算馆展商 80 家★■■,AI 创新应用的前沿应用馆展商数量高达 170 多家。阿里云通义大模型已经服务了超 30 万家企业客户,重点覆盖了互联网、金融■■、汽车、科研◆■★■、医疗、教育、政务、工业制造和零售等领域,包含营销设计、社交、AI 游戏◆★■、在线教育■■◆、智慧终端、自动驾驶◆■★◆◆、智能座舱、金融客服★◆■■★、政务服务、代码开发、药物研发、气象预测、太空探索等场景■■◆。

  除了自研模型的全面开源开放,今年云栖大会更重磅的是阿里云全栈“All in”AI 基础设施,全面重构了面向 AI 的服务器◆■■、弹性计算、网络、存储等全栈技术体系,钻研探索 AI 基础设施的新标准。这一重要技术风向,可以说是一改 AI 系统就要“堆资源、堆硬件”,■◆“搞 AI 就是装备竞赛■★■◆◆★”的 IT 传统思路★◆★■■■,而是从计算存储网络这些云技术底层核心架构的创新,挖掘算力潜力和效率,这可能才是系统性、结构化去满足巨量算力需求的新思路★■。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号■■■◆◆■”用户上传并发布■■◆★★,本平台仅提供信息存储服务。

  朱开预测S14决赛:T1赢面大!左手打Faker占不到便宜,辅助有差距

扫码关注

传真:86-010-57799518

邮箱:zgtdkj@163.com

地址:北京市丰台区丰体时代大厦C座

版权所有©2024 腾博tengbo9888官网,腾博官网入口网址,腾博国际官网新网站功能天地科技(北京)有限公司 All Rights Reserved     备案号:京ICP备13004546号-1