ayx的app
  • 首页
  • 关于我们
  • 产品中心
  • 荣誉资质
  • 新闻中心
  • 成功案例
  • 联系我们
  • 网站地图
  • 产品中心

    ayx的app:沈向洋深圳演讲:当个体能力被AI放大灵巧手是人类在人工智能面前最后的尊严

    来源:ayx的app    发布时间:2025-11-28 13:18:20

    ayx足球俱乐部:

      11月22日,由深圳市科学技术创新局、深圳市福田区人民政府、河套深港科学技术创新合作区深圳园区发展署指导,粤港澳大湾区数字化的经济研究院(IDEA研究院)主办的2025 IDEA大会在深圳会展中心举行。今年大会以“实践驱动创新,技术赋能未来”为核心导向,集中发布了低空经济、具身智能等领域的多项突破性成果,深度探讨了AI与实体经济融合的新路径,为粤港澳大湾区新质生产力发展注入强劲动能。

      作为立足深圳、连接大湾区产学研生态的核心平台,IDEA研究院创院理事长、美国国家工程院外籍院士沈向洋在大会开幕式上发表主旨演讲。他表示,深圳作为“因改革而生、因创新而兴”的城市,正成为全世界智能科技与低空经济创新的策源地,IDEA研究院始终以技术突破为使命,推动科研成果从理论走向实践,为数字化的经济高水平质量的发展提供“中国方案”。

      连续多届成为IDEA大会核心议题的低空经济,此次迎来成果爆发期。在国家低空经济战略布局持续深化、《深圳经济特区低空经济产业促进条例》率先落地、香港成立“发展低空经济工作组”的政策背景下,IDEA研究院发布四项重磅成果,构建起覆盖全产业链的创新体系。

      由沈向洋院士领衔编撰的低空经济专著《低空时代》正式出版发售。该书从基础、应用、法规、系统、技术、安全、开放七大维度,系统构建了低空经济的认知框架与实践路径,深度总结我国低空经济发展经验,精确指出在人工智能赋能下,低空经济已进入“智能化专属时代”。“低空将不再是少数人的飞行领域,而是普惠每个人的立体服务网络,进化为全域联通的城市脉络。”沈向洋在新书发布会上强调。

      同步发布的《低空经济发展白皮书4.0——通导监网络之路》,完成了从1.0“深圳方案”到4.0“通导监网络”的理论迭代。IDEA研究院低空经济分院院长、国际欧亚科学院院士李世鹏介绍,白皮书系列历经“理念—技术—安全”三级跳,此次4.0版本聚焦通信、导航、监测三大核心基础设施,提出构建广域通用通导监网络的具体路径,为低空经济规模化运营破解关键技术难题。

      在技术系统层面,智能融合低空系统OpenSILAS实现从1.0“观察者”到2.0“行动者”的智慧升级。李世鹏院士创新性提出“低空进化论”,强调低空经济发展需适配不一样的地区发展现状,分阶段构建梯度智能管理系统。OpenSILAS 2.0具备“规划—运行—监管—服务”全流程管理能力,可通过分级化、模块化产品矩阵,为不同城市提供可落地、可扩展的解决方案。大会同时宣布OpenSILAS创新联合体新增成员,产学研协同网络持续壮大。

      硬核产品方面,大会外展亮相了两款重磅产品:“高度盒子”低空多元高度基站集成多传感器与通信模块,实现异构高度体系的实时精准转换,破解传统高度信息“不同、不通”的行业痛点;低空一体机则集成OpenSILAS核心系统,支持政务外网或专有网络独立部署,具备“开箱即用”的低空运行管理能力,为低空飞行安全与精细化管控提供坚实支撑。

      2025年中国AI发展进入“实践深耕期”,本届IDEA大会以“实践才是硬道理”为核心基调,集中展示了AI在具身智能、数字智能体等领域的落地成果。沈向洋院士从算法范式、智能载体、交互范式、计算架构和数据五个维度梳理智能演进逻辑,为创新者提供技术与商业落地的思考框架。

      “粤港澳大湾区是全球唯一一个同时拥有机电技术和人工智能技术的地区,这是独特的发展机遇。”沈向洋引用英伟达创始人黄仁勋的评价,强调大湾区在具身智能领域的先天优势。大会展示的三大具身智能项目均出自深圳团队,彰显“硬强软不弱”的产业特色:国内首个灵巧手即时配送场景赛事,以取包裹、拆包裹、按电梯等实际的需求为导向,牵引灵巧手技术突破;“万物抓取”DINO-X Grasp聚焦通用场景落地,提升机器人抓取任务的通用性与稳定性;具身智能软件平台Tairos则以模块化方式提供大模型、开发工具和数据服务,降低具身智能应用门槛。

      “灵巧手是人类在人工智能面前最后的尊严。”沈向洋以特斯拉人形机器人手部技术瓶颈为例,强调灵巧手作为具身智能技术珠峰的重要性,而深圳举办的灵巧手大赛正是通过场景化赛事,凝聚产业力量攻克技术难关。

      在数字智能体领域,大会展示了覆盖企业决策、数据分析、早期药物计算发现的AI copilot系列新产品。沈向洋对未来组织形态提出独到见解:“当AI放大个体能力,许多协作任务可由单个个体端到端完成,未来CEO或许会从‘首席执行官’转变为‘首席氛围官’,组织重心将转向定义问题与融合协作。”

      带领IDEA研究院(粤港澳大湾区数字化的经济研究院)走过第五个年头的沈向洋,新鲜分享了他用来梳理智能演进的五个维度——

      从算法范式维度出发,AI算法已经从构筑表达与生成能力的监督学习阶段,演进到引入因果与执行的强化学习阶段。

      从智能载体维度出发,当下的关注点已从语言和多模态模型,转向世界模型与具身模型。

      过去70年,人机交互经历了命令行、图形界面、搜索、推荐到自然交互的多次范式迁移,每一次迁移背后都对应着底层技术浪潮的变化。

      “今天的产品开发者必须看懂智能特性带来的交互机会。”他同时提到,自然交互内部也在分层:

      被动响应——交互式执行——具备提议能力的主动模式,交互方式从文本扩展到语音、手势乃至未来的脑机接口。

      而计算架构维度已然浮现从通用走向专用、从单一走向多元的趋势。GPU刺激了深度学习的第一波爆发,但能耗与成本也不断攀升。

      于是,性能、成本与能效成了大家追逐的新的平衡点,推理、端侧、强化学习等匹配不同应用任务的专用芯片纷纷涌现。

      最后关于数据——在模拟世界阶段,数据是静态教材;在探索世界阶段,数据是动态反馈;在归纳世界阶段,数据是验证假设的证据。

      从人类数据枯竭到合成数据兴起,再到AI主动探索并获取实验数据,这背后体现出数据从限制模型能力的约束,逐步转变为推动AI主动学习的工具。

      机会并不仅仅来自技术本身,也来自理解技术如何改变载体、交互、计算与数据的方式,如何重新分布能力、资源与价值。

      当个体的能力被AI放大,许多原本需要多环节协作的任务,可以由单个个体端到端完成。

      此次大会上,IDEA研究院还宣布了国际先进技术应用推进中心(深圳)与深港高等研究交流中心(SHARE)两个创新平台,以及一系列创新项目。

      2025 IDEA大会上,IDEA研究院计算机视觉与机器人研究中心负责人张磊,首次系统介绍了研究院在具身智能方向的最新成果:

      过去两年,具身智能异军突起,不少团队试图通过VLA(视觉-语言-动作)大模型架构,让机器人像人一样“听得懂人话,看得懂世界,动得起来”。

      与其从动作建模着手,不如先把“看清楚”这样的一个问题解决得更彻底——这成为了IDEA研究院发力的突破口。

      依托IDEA团队过去在开集目标检测和视觉感知的研究积淀,以强泛化的视觉检测模型DINO-X为基础,IDEA研究院发起了DINO-X Grasp项目。

      在普通4090显卡上,DINO-X Grasp能轻松实现10帧/秒的实时推理速度。

      现场展示的视频中,DINO-X Grasp驱动的机器人灵活应对各种形状各异的物品,从食品包装袋到异形障碍物,一抓一个准。

      写过Re语言的张宏波,现在又带领团队在IDEA研究院开发MoonBit。

      沈向洋特别提到,张宏波是他知道的唯一一个写的编程语言全世界有以万为计量单位的人数在用的人。

      他所带领的MoonBit团队2022年底才成立,刚好赶上了ChatGPT横空出世。张宏波在台上分享时说:“作为新的编程语言,(赶上这一段时间点),可以让我们有机会重新思考在AI时代下怎么做开发者工具。”

      它是所有编程语言史上第一个原生提供AI助手的语言,还为语言模型打造了基于语义分析的IDE。

      更重要的是,MoonBit的性能表现出色。在数字计算等基准测试中,性能超越Java近10倍;WebAssembly后端代码体积比Rust小30%,是Type和Go的50%。

      过去一年半,MoonBit从一门支持多后端的编程语言,逐步演进为完整的全栈工具链(包含专为AI设计的原生工具集),最终构建起集开发者工具链与智能体开发生态于一体的开发者平台。

      张宏波透露,MoonBit已经有了商业付费客户,包括北美的云厂商用它来进行服务器开发。”大部分编程语言在前四年、前五年都是默默无闻的,而我们在这么早的阶段就累积了这么多用户。”

      目前,MoonBit的用户从去年的2.6万到现在超过了10万。张宏波预计到2026年底会有接近100万用户,“成为首个从中国走出去的有世界影响力的开源平台”。

      下个月,用MoonBit编程语言开发的、支持使用多种编程语言的智能体平台MoonBit agent SDK将正式开源。

      王嘉平团队的GPU渲染器Smaray是更为直观的IDEA研究院新近成果。

      “在电影工业中,一个镜头通常包含几百个G的数据。”王嘉平在演示时介绍,电影工业的渲染和游戏完全不同。游戏要求毫秒级响应,而电影渲染一帧画面在大多数情况下要几小时甚至一天。