加载中...
推荐位 推荐位

人工、DeepL、讯飞翻译的比较

发布时间:2023.05.18 北京市查看:739 评论:2

以苹果公司的美国专利US10331558B2的权利要求1为例。

1. An apparatus comprising:

a first buffer configured to store a plurality of input words;

a table comprising a plurality of entries; and

compression circuitry comprising a first plurality of hardware lanes, wherein in response to receiving an indication of a compression instruction, the compression circuitry is configured to:

assign a first group of two or more input words from the plurality of input words to the first plurality of hardware lanes;

determine at least two of the first group of two or more input words correspond to a same entry of the table;

prior to determining dependencies between input words of the first group:

determine whether to update the table with any of the input words of the first group; and

assign a second group of input words from the plurality of input words to the first plurality of hardware lanes, wherein the second group is different from the first group;

generate a compression packet that stores data corresponding to the plurality of input words.

以下,设定US10331558B2CN同族文本为人工,与DeepL、讯飞翻译进行比较。

 

a first buffer configured to store a plurality of input words;

人工:第一缓冲器,所述第一缓冲器被配置为存储多个输入字;

DeepL第一缓冲器,被配置为存储多个输入字;

讯飞:第一缓冲器,被配置为存储多个输入字;

--- 三者无实质差异。人工版本中有“第一缓冲器,所述第一缓冲器被配置为”,这种加词处理是可以理解的。这里的“configured to”是配置为、构成为的意思,联系前后文时或可省略,但专利翻译中省略词的做法通常不被认可。

 

a table comprising a plurality of entries; and

人工:表,所述表包括多个条目;和

DeePL一个包括多个条目的表;以及

讯飞:包括多个条目的表;和

--- 三者仅有一些形式上的差异。人工版本的“表,所述表包括”的形式与上一句统一。DeepL版本的问题较大,“一个”显得突兀,这与上一句在形式上也不统一。从形式上来说,这一句人工版本胜出。

 

compression circuitry comprising a first plurality of hardware lanes, wherein in response to receiving an indication of a compression instruction, the compression circuitry is configured to:

人工:压缩电路,所述压缩电路包括第一多个硬件通道,其中响应于接收到压缩指令的指示,所述压缩电路被配置为:

DeepL压缩电路,包括第一多个硬件通道,其中,响应于接收压缩指令的指示,压缩电路被配置为:

讯飞:包括第一多个硬件线路的压缩电路,其中响应于接收到压缩指令的指示,所述压缩电路被配置为:

--- 三者有一些形式上的差异。以人工为基准,DeepL的选词“第一多个硬件通道”、及整句表达显得完美。讯飞的惊艳之处在于译出了“所述压缩电路”,可能是采用了一些适用于专利翻译的算法。

 

assign a first group of two or more input words from the plurality of input words to the first plurality of hardware lanes;

人工:将所述多个输入字中的第一组两个或更多个输入字分配给所述第一多个硬件通道;

DeepL将来自多个输入字的第一组两个或多个输入字分配给第一多个硬件通道;

讯飞:将来自所述多个输入字的两个或更多个输入字的第一组分配给所述第一多个硬件通道;

--- 三者的差异大。首先,对于“a first group of two or more input words from the plurality of input words人工和DeepL版本为“将(所述)多个输入字中的第一组两个或更多个输入字”,讯分版本为“将来自所述多个输入字的两个或更多个输入字的第一组”。这里,原文的“a first group”和“two or more input words”的关系也可以是第一组由两个以上的输入字构成,即在缓冲器中存储的多个输入字中,将特定的两个以上的输入字设为第一组。这么看来,人工和DeepL版本的“第一组两个或更多个输入字”还是有待商榷之处。其次,对于“from the plurality of input words”,人工版本为“所述多个输入字中的”,而DeepL和讯飞选择的译法式“来自(所述)多个输入字”。参考以上的“在缓冲器中存储的多个输入字中,将特定的两个以上的输入字设为第一组”时,人工版本的“所述多个输入字中的”更佳。与DeepL相比,讯飞的表现还是足够惊艳,但讯飞也有一些用词混乱、不够稳定的问题,如“第一多个硬件通道”、“第一多个硬件线路”的混用。

 

determine at least two of the first group of two or more input words correspond to a same entry of the table;

人工:确定所述第一组两个或更多个输入字中的至少两个对应于所述表的相同条目;

DeepL确定第一组两个或更多的输入字中至少有两个对应于表的同一条目;

讯飞:确定第一组的两个或多个输入字中的至少两个输入字对应于表中的同一条目;

--- 三者意思相差不大,DeepL稍显逊色。讯分版本的“确定第一组的两个或多个输入字中的至少两个输入字对应于表中的同一条目”有加词“至少两个输入字”,此外,讯飞在“所述”的用法上也显得不太稳定。至于这句话原本的意思,讯飞的版本或更接近于正确答案。

 

prior to determining dependencies between input words of the first group:

人工:在确定所述第一组的输入字之间的依赖关系之前:

DeepL在确定第一组的输入字之间的依赖关系之前:

讯飞:在确定第一组输入字之间的相关性之前:

--- 三者无实质差异。人工版本为基准,DeepL和讯飞皆表现出色。如果注意到“所述第一组的”和上文的“第一组两个或更多个输入字”的微妙之处,关于这句话,人工版本反而是有点小问题。

 

determine whether to update the table with any of the input words of the first group; and

人工:确定是否用所述第一组的所述输入字中的任一个来更新所述表;以及

DeepL确定是否用第一组的任何一个输入字来更新该表;和

讯飞:确定是否用第一组的任何输入词更新该表;和

--- 三者无实质差异,DeepL或更胜一筹。人工版本的“所述第一组的”还是与上文有些许出入。

 

assign a second group of input words from the plurality of input words to the first plurality of hardware lanes, wherein the second group is different from the first group;

人工:将所述多个输入字中的第二组输入字分配给所述第一多个硬件通道,其中所述第二组与所述第一组不同;

DeepL将多个输入字中的第二组输入字分配给第一个多个硬件通道,其中,第二组与第一组不同;

讯飞:将来自所述多个输入字的第二组输入字分配给所述第一多个硬件通道,其中所述第二组不同于所述第一组;

---三者无实质差异。讯分的表现惊艳。

 

generate a compression packet that stores data corresponding to the plurality of input words.

人工:生成存储对应于所述多个输入字的数据的压缩包。

DeepL产生一个压缩包,该压缩包存储与多个输入字对应的数据。

讯飞:产生一压缩封包,该压缩封包储存对应于该多个输入字的数据。

--- 三者无实质差异。DeepL版本稍显特别,但也很好。讯飞还是有不稳定的问题,如“store”一词,上文和下文的选词就不统一。

 

总的来看,人工版本规范、精确。DeepL在专利英译中上没有突出的优势,而讯飞翻译平台在专利中英文的语句理解、表达整合上有惊艳的表现,但有一点不太稳定。


分享(1)

收藏

点赞

举报

评论列表

  • 第1楼
    上一篇比较了讯飞、DeepL的英译中性能。以下,反向做一下两者中译英的对比。英文原文为美国专利US10331558B2的权利要求1,中文是同族CN的权利要求稍加以改动的版本。对于讯飞、DeepL的英译结果,基于英文原文做了修改(有修改标记),修改之处越多则表明选词上的差异越大。另外,斜体加重的部分为明显存在异议的语句。
    作为有趣的一个比较,附上讯飞、DeepL英译日的结果。

    1、一种装置,包括:

    配置为存储多个输入字的第一缓冲器,
    英文原文:
    1. An apparatus comprising:
    a first buffer configured to store aplurality of input words;
    讯飞版本:
    1. An apparatus comprising:
    A first buffer configured to store aplurality of input words,
    DeepL版本:
    1. an apparatus comprising:
    a first buffer configured to store aplurality of input words, the

    包括多个条目的表,及
    英文原文:
    a table comprising a plurality ofentries; and
    讯飞版本:
    A table comprising a plurality ofentries, and
    DeepL版本:
    comprising a plurality ofentry tables, and

    包括第一多个硬件通道的压缩电路;其中,响应于接收压缩指令的指示,所述压缩电路被配置为:
    英文原文:

    compression circuitry comprising afirst plurality of hardware lanes, wherein in response to receiving anindication of a compression instruction, the compression circuitry isconfigured to:
    讯飞版本:
    A compression circuit comprising afirst plurality of hardware lanes, wherein, in response to receiving anindication of a compression instruction, the compression circuit is configuredto:
    DeepL版本:
    a compression circuit comprising afirst plurality of hardware channelslanes; wherein, in response to an instruction to receive a compressioninstruction, saidthe compressioncircuit is configured to

    将所述多个输入字中的第一组两个以上个输入字分配给所述第一多个硬件通道
    英文原文:
    assign a first group of two or moreinput words from the plurality of input words to the first plurality ofhardware lanes;
    讯飞版本:
    Assign a first setgroupof more than two input words in the plurality of input words to the firstplurality of hardware channelslanes,
    DeepL版本:
    assigning saidthefirst setgroupof two or more input words of saidthe plurality ofinput words to saidthe firstplurality of hardware channelslanes, and

    确定所述第一组两个以上输入字中的至少两个对应于所述表的相同条目,
    英文原文:
    determine at least two of the firstgroup of two or more input words correspond to a same entry of the table;
    讯飞版本:
    Determining Determinethat atleast two of the first setgroup of more thantwo input words correspond to the same entry of the table,
    DeepL版本:
    determining determinethat atleast two of saidthe first setgroupof two or more input words correspond to the same entries in saidthetable, and

    在确定所述第一组的输入字之间的依赖关系之前:
    英文原文:
    prior to determining dependenciesbetween input words of the first group:
    讯飞版本:
    Before determining the dependenciesbetween the input words of the first group:
    DeepL版本:
    before determining the dependenciesbetween the input words of saidthe first group:

    确定是否用所述第一组的任意输入字来更新所述表,及
    英文原文:
    determine whether to update thetable with any of the input words of the first group; and
    讯飞版本:
    Determineingwhether to update saidthe table withany of saidthefirst setgroupof input words, and
    DeepL版本:
    determineingwhether saidthetable is to be updated with any input word of saidthefirst group, and

    将所述多个输入字中的第二组输入字分配给所述第一多个硬件通道,其中,所述第二组不同于所述第一组,
    英文原文:
    assign a second group of input wordsfrom the plurality of input words to the first plurality of hardware lanes,wherein the second group is different from the first group;
    讯飞版本:
    Assign a second setgroupof input words from the plurality of input words to the first plurality ofhardware channelslanes,wherein the second setgroup is differentfrom the first setgroup,
    DeepL版本:
    assigning a second setgroupof input words of saidthe plurality ofinput words to saidthe firstplurality of hardware channelslanes, wherein saidthesecond setgroupis different from saidthe first setgroup, and

    生成存储对应于所述多个输入字的数据的压缩包。
    英文原文:
    generate a compression packet thatstores data corresponding to the plurality of input words.
    讯飞版本:
    Generateinga compressionpacketcompressed packet storing datacorresponding to the plurality of input words.
    DeepL版本:
    Generateinga compressedpackagecompression packet storing datacorresponding to saidthe plurality ofinput words.

    ————英文至日语———
    1. 装置: 第1のバッファは、複数の入力ワードを格納するように構成される、
    複数のエントリを含むテーブル、および
    第1の複数のハードウェアチャネルを含む圧縮回路であって、圧縮命令の指示を受信することに応答して、圧縮回路は、以下のように構成される:
    複数の入力ワードからの2つ以上の入力ワードの第1のセットを第1の複数のハードウェアチャネルに割り当てることと;
    2つ以上の入力ワードの第1のセットのうちの少なくとも2つがテーブルの同じエントリに対応することを決定することと;
    第1のセットの入力ワード間の依存性を決定する前に:
    テーブルが第1のセットのいずれかの入力ワードで更新されるかどうかを決定することと、および
    複数の入力ワードからの第2のセットの入力ワードを第1の複数のハードウェアチャネルに割り当て、第2のセットは第1のセットとは異なる;
    複数の入力ワードに対応するデータを格納する圧縮パケットを生成する。

    1. を備える装置であって
    複数の入力語を格納するように構成された第1のバッファと
    複数のエントリを含むテーブル;および
    第1の複数のハードウェアレーンを含む圧縮回路であって、圧縮命令の指示を受信することに応答して、前記圧縮回路は、以下のように構成される:
    前記複数の入力語から2つ以上の入力語の第1のグループを前記第1の複数のハードウェアレーンに割り当てる;
    前記2つ以上の入力語の第1のグループのうちの少なくとも2つが、テーブルの同じエントリに対応することを決定する;
    前記第1のグループの入力語間の依存関係を決定する前に、前記第1のグループの入力語間の依存関係を決定すること
    第1のグループの入力語のいずれかを用いてテーブルを更新するかどうかを決定する;および
    複数の入力語から入力語の第2のグループを第1の複数のハードウェアレーンに割り当てるステップであって、第2のグループは第1のグループと異なる、ステップ;
    前記複数の入力語に対応するデータを格納する圧縮パケットを生成するステップと

    2023/05/23 15:11 [来自北京市]

    0 举报
  • 第2楼
    上一篇格式有点乱了,将就看一下意思吧。
    感觉是这样的。讯飞在(专利文献的)英译中、中译英上均有一些特殊的表现,结果输出较严谨,很少出现加减词、格式混乱的情况。DeepL就不一样了,DeepL在(专利文献的)英译中、中译英上似乎没有多做耕耘,但DeepL的优点是对于英文的掌控和把握非常自然。也就是说,DeepL在一般情景的翻译上可能更佳一些,而讯飞显然理科直男了一点。
    一个有趣的现象是,DeepL在(专利文献的)英译日上有突出的表现,尽管有格式混乱的问题,但在英日互换的语句编排上显然有过训练。
    总之,一个讯飞不够,那就DeepL补上,两者加成基本上还是会有不错的结果。

    2023/05/23 15:24 [来自北京市]

    0 举报

快速回复

头像

老亓

[4]思博县县长

[北京市]

主题:1 回帖:20 积分:161