发布日期:2026-06-21 00:58点击次数:

海天瑞声CTO黄宇凯。东说念主民网记者 翁奇羽摄
东说念主民网自贡6月17日电 (记者焦磊)6月16日,由东说念主民网把持的2026东说念主民数据大会在四川省自贡市举行。海天瑞声CTO黄宇凯在主旨发言中暗意,高质地数据集是东说念主工智能模子才调普及的热切基础,鼓吹高质地数据集修复,需要从总体主意、工程化修复、质地评测和产业生态等方面协同发力。
黄宇凯暗意,高质地数据集可平直用于开辟和考研东说念主工智能模子,是能有用普及模子性能的数据汇注,具有规模大、质地高、安全牢、不雅点正、后果好、应用广等中枢特质,是大模子才调的基础,也决定了模子才调的上限。
黄宇凯以为,高质地数据集修复应免除“总体主意、分步实施,先易后难、先简后繁”的原则。他暗意,数据是东说念主工智能的要道基石,也联系企业和组织里面多部门、多系统协同,需要顶层预备和率领。
关于围绕修复旅途,澳门永利皇宫中国官网入口黄宇凯暗意,高质地数据集修复需要从供给侧和需求侧两个主意发力。从供给侧看,应站在数据产物和数据就业角度,在数据分娩、数据处治、数据供给等方面加大参预;从需求侧看,则应站在东说念主工智能赋能各行业、各场景落地的角度,以应用需求牵引数据修复、开释数据价值。两者之间,天博体育(TianboSports)官网需要通过数据期间、数据就业和数据生态协同供需两头,促进东说念主工智能产业高质地发展。
真确数据空间修复与行业高质地数据集修复密切谈论。对此,黄宇凯暗意,围绕国度数据局鼓吹的真确数据空间,不错从个东说念主、企业、行业、城市、跨境等不同层面伸开,把柄不同真确数据空间面向的应用场景,需要数据提供方、使用方、就业方、运营方和监管方等多方共同参与。
黄宇凯先容,在文旅行业,海天瑞声也在多个景区推动多模态伴游助手应用,诈欺景区文本、图片、视频等数据,汇注具体应用场景打造文旅行业高质地数据集,推动导览就业从被迫反应向主动就业、从通用谜底向深度体验滚动。在数字东说念主领域,围绕直播带货、品牌宣传、动画游戏、文化实践等不同场景,也存在文本、声息、视频等多模态定制化数据需求。
据先容,海天瑞声汲引于2005年,永久专注于东说念主工智能高质地数据集才调修复和产物就业,已累计造成1800多个数据集,就业各人朝上1200家客户。
黄宇凯暗意,汇注东说念主才资源、数据资源和工程化、规模化智能平台才调天博体育app下载,捏续构建高质地数据集,将有助于东说念主工智能更好赋能千行百业。
