北京拟整合现有开源中文预训练数据集和高质量互联网中文数据 世界即时看
(相关资料图)
北京商报讯(记者 杨月涵)5月16日,据北京市科委官网,北京出台《北京市促进通用人工智能创新发展的若干措施(2023-2025年)(征求意见稿)》,针对目前大模型训练高质量中文语料占比过少,不利于中文语境表达及产业应用的问题,征求意见稿提到,整合现有开源中文预训练数据集和高质量互联网中文数据并进行合规清洗。同时持续扩展高质量多模态数据来源,建设合规安全的中文、图文对、音频、视频等大模型预训练语料库,通过北京国际大数据交易所社会数据专区进行定向有条件开放。
关键词:
上一篇:即时:火红郁金香图片 火红郁金香
下一篇:最后一页
精心推荐
- 北京拟整合现有开源中文预训练数据集和高质量互联网中文数据 世界即时看
- 即时:火红郁金香图片 火红郁金香
- 即时焦点:《凝心铸魂跟党走 团结奋斗新征程》——劳动最光荣|全国劳模陈显武:下岗矿工自学成为机电技术专家
- 中山小学及初中学校汇总(咨询电话+地址)
- 今日关注:国家统计局:2023年1-4月份全国固定资产投资增长4.7%
- 奥迪版“保时捷 macan ”曝光!年内国产开售,比宝马 X3 耐看
- 暴雨!长沙今天暴雨! 环球热闻
- 让生命之花绽放光彩 科华中路小学班主任教研如期开展-世界今日讯
- 拓A股版图 马伟将入主华菱精工 今日快看
- 今日播报!中国东航:5月15日融资买入991.62万元,融资融券余额3.41亿元
- 消息称 OpenAI 正在准备新的开源 AI 模型
- 【全球播资讯】OMNIQ(OMQS.US):2023年Q1财报实现营收2782.1万美元
- 实时:电脑卡慢怎么处理_电脑卡怎么处理
- 环球快资讯:6个月宝宝晚上睡觉经常醒_6个月宝宝晚上睡觉老是醒是怎么回事
X 关闭
X 关闭
产业
-
不用跑北京 在家门口也能挂上顶...
日前,我省首个神经疾病会诊中心——首都医科大学宣武医院河北医院...
-
“十四五”期间 河北省将优化快...
从省邮政管理局获悉,十四五期间,我省将优化快递空间布局,着力构...
-
张家口市宣化区:光伏发电站赋能...
3月19日拍摄的张家口市宣化区春光乡曹庄子村光伏发电站。张家口市宣...
-
“张同学”商标被多方抢注 涉及...
“张同学”商标被多方抢注,官方曾点名批评恶意抢注“丁真” ...
-
山东济南“防诈奶奶团”花式反诈...
中新网济南12月15日电 (李明芮)“老有所为 无私奉献 志愿服...
-
广州新增1例境外输入关联无症状...
广州卫健委今日通报,2021年12月15日,在对入境转运专班工作人...
-
西安报告初筛阳性病例转为确诊病例
12月15日10:20,经陕西西安市级专家组会诊,西安市报告新冠病毒...
-
广东东莞新增本土确诊病例2例 ...
(抗击新冠肺炎)广东东莞新增本土确诊病例2例 全市全员核酸检测...
-
中缅边境临沧:民警深夜出击捣毁...
中新网临沧12月15日电 (胡波 邱珺珲)记者15日从云南临沧边境...
-
“土家鼓王”彭承金:致力传承土...
中新网恩施12月15日电 题:“土家鼓王”彭承金:致力传承土家...