当前位置:首页 > 科技 > 华为EMUI10“滚屏翻译”之背后的学问

华为EMUI10“滚屏翻译”之背后的学问

2025-05-12 阅读 0

IT前沿10月17日媒体报道 此前,华为官方已发布一则短完整视频以作介绍华为Mate30系列新新手机接入的“滚屏翻译”多种功能 。还没有华为EMUI官方微信号撰文详解EMUI10“滚屏翻译”及其背后的O科技小发明科技小发明CR各种技术,便是可以看出就来吧。

华为EMUI官方则表示,EMUI10全屏翻译的反复不存在,解决解决问题了外文翻译的解决问题,本来就能还想翻译多屏其他内容,就能五次又五次展开全屏翻译的去操作。日益其他内容长度的减少,去操作的繁复还能使阅读的连贯性减少。基于此,“滚屏翻译”便派进了用场。

EMUI10滚屏翻译最大支持各式各样应用、十种语言、多屏其他内容的翻译。展开小艺语音口令“帮我翻译屏幕”或双指按压屏幕方法二展开。华为EMUI官方则表示,“你自己浏览一篇文章长一篇文章文章就能翻译时,系统提供会先将其滚动截屏,构成一张原文的长截图,然后对长截图展开切分、文本检测、翻译、排序、去重、拼接,然后以则是的图源和翻译已完成的文字,回到呈还没有你自己跟前,这便是滚屏翻译。”

在一个系列的步骤中,最为最最重要 则是是如何对长截图展开初步处理方式。那多种渠道是如何各种技术去展开处理方式呢?这个又不得不一篇文章一篇文章这个面的最最重要 各种技术——OCR各种技术。

上述为华为EMUI官方对OCR各种技术的详解:

OCR,即光学字符识别(Optical Character Recognition),指检查后字符,展开其展开检测识别,最然后将其字符形状转换成计算机文字的阶段所。在一个的应用,也便是对竟然长一篇文章文章构成的长截图上都文字,展开识别提取,将动物应用提供给后续的机器翻译阶段展开,也便是已完竟成长篇源文字提取的阶段所。

从各种技术原理上为检测和识别两段式算法框架,涉及中、英、日、韩、俄、西、法、德、意、葡十种语言识别各种技术能力,包含多个运行于NPU(Neural-network Processing Unit,神经图源处理方式单元)的深度模型。

调用OCR算法后,上述几点对图像做降低处理方式,将图源适配至理想稳定状态后,采用传统多线程的多种渠道同步运行深度模型与此的的后处理方式运算,然后多种渠道NLU(Natural Language Understanding,还想语言正确理解)校正输出文本识别然后。

翻译得准不准,依赖于OCR识别的准确性;翻译得快不快,依赖于OCR处理方式字符非常快的快慢。将利用它OCR处理方式的文本展开机器翻译,回到对图源展开排序、拼接处理方式,然后把翻译很好长篇一篇文章文章呈还没有现有用户跟前。

或科技小发明许一套能把长一篇文章一篇文章都文字转变为图源,再转换成译文的创新方案,还没有还没有申请专利保护了噢!

//每行字每张图,都会完完整整//

滚屏翻译中还创新性地展开OCR文本行定位以已完成智能的图源切分和拼接,巧妙地以免了在长截图切分阶段所中文字或图源被截断的现象发生发生。

这个本来还能或许的疑问,原文构成的长截图然后翻译没法吗?为是如何还想 做切分呢?

便是便是,当前的图源翻译只最大支持单屏其他内容的翻译,长截图会自动缩放成和屏幕等高展开翻译,图源被压缩,文字大小还想也被压缩了,这会大大地很大很大影响翻译然后的准确性。

只为非常有效减少翻译的准确性,的话把长截图切分成多张短图然后做翻译吧。但就能然后遵循屏幕最高高度对长截图做十分简单切分,很本来会反复不存在一行文字被截断就能一张插图被截断的现象发生发生。

而滚屏翻译,采用传统OCR各种技术,就能检测出一行文本或图源的主要位置坐标,就能偶然发现切分主要位置正好处在某行或某张图源前面,则会向上移动到行间空白主要位置展开切分。

以或许规则处理方式后的图源宽度同屏幕一致,最高高度等于或略低于屏幕最高高度,每一行字和每一张图便是完整的。或许方案巧妙实用,在非常快快的与此的的,还基本保证了这个的翻译体验感受受。

预约SEO专家添加微信号:xxxxxxx 领取免费VIP内部课程
© 著作权归作者所有
满江鸿网络科技 作者
满江鸿网络科技是专业科技新媒体网站。网站著眼于新一代科技新闻的全面及时处理报导,让网民在外面第二时间交待全球新一代的科技资讯。内容涵括AI+、互联网、IT、创业投资、核定、区块链、智能硬件等领域
曾操作某大型门户网站日IP达100万(纯SEO流量),拥有上千网站提供SEO友情链接资源(参加培训免费赠送100个单向友情链接),免费赠送附子SEO内部VIP课程,2018年新版实战课程介绍