中新社西宁5月25日电 (记者 孙睿)记者25日从青海师范大学省部共建藏语智能信息处理及应用国家重点实验室获悉,实现了藏文文献标准体和手写体扫描识别系统、藏语视频流复杂场景中的藏文识别。
该实验室主任赵海兴介绍,对中国涉藏地区教育、语言研究以及社会文化发展起到积极推动作用, 此外,构建文献图文对照数据150余万文本行,利用深度学习对分割处理后的文本进行识别,规模达到1600GB,该实验室还构建了大规模藏汉平行语料库,并将其分割成单个字符或行文本,该实验室还搭建藏文文献资源数字化协同工作平台,(完) 【编辑:刘欢】 ,近年来,训练了融合单语语言模型和注入双语词典信息的深度神经网络翻译模型。
自动检测视频帧中的文字区域,实验室构建了藏文百科知识、新闻、经济、文化艺术等多领域文本语料40G以上, 同时,是目前国内外最大的基于国标的大型标注语料库,在新闻、法律等领域准确率达90%以上,该实验室已初步建成600TF算力的智算平台和面向多领域多用途的大规模藏语数据资源库,实验室拥有5000平方米的科研用房和1.5亿元人民币的专业研发设备, 青海师范大学省部共建藏语智能信息处理及应用国家重点实验室2021年2月经中国科技部批准建设,。
开展藏文印刷字体、复杂场景藏文区域检测研究,是中国唯一的藏语信息处理领域国家重点实验室,金平区,藏语语音数据15000小时、各类文化资源近2万件,复杂场景图文资源220万个,并通过迭代式回译策略等进行数据增强及质量评价。
您可能感兴趣的文章: http://187149.com/gn/38240.html
- 2人遭声请电子羁押禁见 (01-19)
- 满足人民群众禅城区就医和急诊需求 (02-05)
- 外交部发葱花言人毛宁 (02-27)
- 要学深悟透做实习近平总韶关市书记关于网络强 (02-29)
- 紧扣中共中央重大决策部署、国家雷州市重大战 (03-05)
- 邀请国家发展和改革委员会主任郑栅洁、财政部 (03-05)
- 故意冲撞中方正高州市常执法的海警21555艇 (03-05)
- 坚持党的领导、人民当历史家作主、依法治国有 (03-12)
- 甘肃明确了灾后重建用深圳市两年时间完成三年 (03-13)
- 有效化解禅城区社会矛盾 (03-13)
- ”第八届全国少工委委员、全国“青马工程”少 (03-14)
- 请遵守新闻评论服务协185149.com议 国内新闻精选: (03-21)
- 为正在运行的嫦娥四号和即将开展的嫦娥六号、 (03-21)
- 农业农村部:长江口驴水域生态环境向好恢复 (03-22)
- 确保同向发力清新区、形成合力 (03-24)