家电网-HEA.CN报道:针对目前大模型训练高质量中文语料占比过少,不利于中文语境表达及产业应用的问题,整合现有开源中文预训练数据集和高质量互联网中文数据并进行合规清洗。加快推动数据要素高水平开放的“国家数据基础制度先行先试示范区”建设,争创国家级数据训练基地,提升北京人工智能数据标注库规模和质量。
证券时报网讯,据北京市科委网站消息,为抢抓大模型发展机遇,推动北京市通用人工智能领域实现创新引领,北京市科委、中关村管委会制定了《北京市促进通用人工智能创新发展的若干措施(2023-2025年)(征求意见稿)》,现向社会公开征求意见。
意见稿提出,加强与头部公有云厂商等市场主体合作,实施算力伙伴计划,并确定首批伙伴计划成员;将新增算力建设项目纳入算力伙伴计划,加快推动海淀区“北京人工智能公共算力平台”,朝阳区“北京数字经济算力中心”等项目建设。
针对目前大模型训练高质量中文语料占比过少,不利于中文语境表达及产业应用的问题,整合现有开源中文预训练数据集和高质量互联网中文数据并进行合规清洗。加快推动数据要素高水平开放的“国家数据基础制度先行先试示范区”建设,争创国家级数据训练基地,提升北京人工智能数据标注库规模和质量。
(家电网® HEA.CN)
责任编辑:编辑E组