微信扫码
添加专属顾问
我要投稿
轻量级大模型如何实现端侧高效部署?极视角发布0.8B版星际视觉语言大模型,为产业终端带来低成本、高隐私的AI能力。核心内容:1. Stellaris-VL-0.8B模型的三大核心优势与产业级能力2. 模型在架构轻量化、推理稳吞吐方面的关键优化3. 终端广适配与本地高安全的落地价值
近日,“2026 高通×极视角端侧AI开发者技术日暨2025骁龙人工智能创新应用大赛颁奖典礼”在深圳举办。
会上,极视角算法专家邓富城以“星际视觉语言大模型(Stellaris-VL)进化之路”为主题深入分享,并正式发布了面向端侧与嵌入式设备应用的0.8B轻量版,为各类终端提供高性能AI服务。
大会现场,极视角自主研发的高精度全栈视觉语言大模型首次线下开放体验,成为本次技术日活动的人气亮点。极视角体验区人头攒动,吸引了众多与会专家学者、AI应用开发者及技术团队驻足交流。
现场观众围绕星际视觉语言大模型的核心能力、部署及应用方式、行业落地方案等展开探讨,更直接上手实操,直观体验星际视觉语言大模型在产业多场景下的智能检测识别、精准目标定位、复杂画面智能分析能力,感受端侧应用高效流畅的交互体验。
△星际视觉语言大模型展示及体验区
“端侧多模态大模型绝非云端能力的简单精简下放,如何在有限硬件条件下兼顾性能与效率,是产业落地的核心命题。”邓富城谈到,当下端侧AI已成为产业智能化升级的主流应用方向,工业、园区、城市治理等行业场景,对复杂目标识别、实时图像解析有着刚性需求。但产业终端面临的算力有限、硬件配置参差不齐、数据管控严格等现实约束,依然制约着视觉大模型的规模化应用。
为平衡模型性能与落地效率,极视角基于星际视觉语言大模型原生底座,针对端侧硬件约束进行模型架构专项优化,推出专为端侧与嵌入式设备设计的Stellaris-VL-0.8B轻量版。
△极视角算法专家邓富城发表主题分享并发布0.8B轻量版
Stellaris-VL-0.8B完整继承了星际视觉语言大模型原生的“强性能”、“低幻觉”、“可落地”三大核心优势,聚焦开放词汇目标检测(OVD)、指代表达理解(REC)、视觉问答(VQA)等产业级核心能力,并实现了模型体积、推理延迟、硬件占用的多重“瘦身”,让多模态细粒度感知理解能力以低成本、低功耗、高隐私的方式运行于端侧。
核心亮点
测评表现
为验证Stellaris-VL-0.8B的综合性能,本次活动同步展示了模型核心能力和推理效率等多维度测评数据。
在权威公开数据集测评中,Stellaris-VL-0.8在ODinW13开放词表检测、指代表达式定位等测评表现大幅领先于同等参数版本的主流开源大模型。基于工业巡检、城市感知、安防、能源等1000+真实产业场景的产业综合检测集测评显示,模型mAP@0.5:0.95指标远超同等参数量的开源模型,显示了Stellaris-VL-0.8B针对工业复杂画面、多目标场景的识别、定位精准度实现显著提升,更低幻觉、更少错检漏检,高度适配无人机、移动机器人等多视角作业设备。
△产业综合数据集及公开数据集测评
场景应用演示
Stellaris-VL-0.8B为低空无人机、移动巡检机器人、车载/船载/矿载视觉等各类端侧的AI视觉应用提供了高效、实用的AI视觉基座,广泛应用于工业巡检、应急管理、城市治理、安全生产、矿山安监等产业场景,助力各行业加速智能化升级。
开放词汇目标检测(OVD)
△点击可放大查看,左右滑动可查看更多,
指代表达理解(REC)
△点击可放大查看,左右滑动可查看更多
视觉问答(VQA)
△点击可放大查看,左右滑动可查看更多
“从4B到0.8B版本,是星际视觉语言大模型面向产业应用的又一次重要进化。”邓富城现场总结道。接下来,极视角将与高通等众多技术和产业伙伴,依托轻量化模型优势,持续推动视觉大模型在端侧场景中的规模化落地。
推荐阅读
极视角「星际视觉语言大模型4B版本」深度解读:强性能、低幻觉、可落地
极视角入选图像图形先锋金牌榜,星际视觉语言大模型细粒度感知与推理效率再进阶
VALSE2026|极视角算法专家邓富城:视觉语言大模型的技术与工程化实践路径
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-16
RapidOCR: 从 setup.py 迁移到 pyproject.toml 打包实践
2026-06-12
PaddleOCR 3.7 正式接入ONNX Runtime,一个参数换后端,轻量部署新选择
2026-06-11
本地部署OCR,可能是AI进单位的第一道门
2026-06-08
正式推出 Gemma 4 12B: 一款统一、免编码器的多模态模型
2026-05-30
还在用 MinerU 解析 PDF?这个 2B 小模型直接把 olmOCR-bench 刷到 87.6%,速度还快 3.68 倍
2026-05-30
Qwen-VLA:迈向通用具身智能的统一动作框架
2026-05-25
罗福莉说的“伪多Agent”,我试了OmniWork后发现,真全干专家长这样
2026-05-19
从画稿到代码,AI Agent 正在吃掉产品设计的中间环节
2026-04-22
2026-04-01
2026-04-02
2026-03-29
2026-04-21
2026-04-27
2026-04-09
2026-03-31
2026-04-15
2026-04-02
2026-03-12
2025-12-31
2025-08-04
2025-05-26
2025-05-13
2025-04-08
2025-04-05
2025-03-30