新用户登入 登录
萌子岛 返回首页

specialshe的个人空间 https://www.dommdo.com/?1152339 [收藏] [复制] [RSS]

日志

2

已有 44 次阅读2013-2-3 09:30

1.           ここには分岐があらわした。一つ用は(searching).これにする論文はTSUBAKI: An Open Search Engine Infrastructure for Developing Information Access Methodology, Relevance Feedback using Latent Information。前者のあらすじは、a.ネット標準格式(Web Standard Format)を紹介し,ネット情報はにはテキスト形式、分析可能。b.索のセンテンスを分析し、そのなかの言葉を似ているほかの表現方で一索。c.結果への審査。d。TSUBAKI APIのご紹介後者は索方法を念し「いったいどうのなサイトは索にてはまるのか?標準は何だ?」、いろいろのモデルを提供した。特にLatent Informationを使用した。

2.           3のき。成分標識の後、連度の認識がスタトです。その原因は言葉には省略が多い。連ができてあれば、その省略は推測できます。これにする論文はAcquiring Strongly-related Events using Predicate-argument Co-occurring Statistics and Case Frames A Discriminative Approach to Japanese Zero Anaphora Resolution with Large-scale Lexicalized Case Frames,二つの論文はともにcase frameをつくり(1)。前者はcase frameの間直接比較し、スコアを計算し、「が」「を」「に」とかともに分析し、連を判する。後者は統計の最尤推定を利用し、一つの公式を作り、そのparametertraining dataで統計知識を用いて獲得。

3.           ここからはプログラムの世界、以前は数学主。コンパイル原理から見ると、翻現するために、構文木を構築なければならない。これにする論文はEBMT System of KYOTO Team in PatentMT Task at NTCIR-9, Japanese-Chinese Phrase Alignment Using Common Chinese Characters Information,前者は大まかにtree-based translationを紹介した。後者は中à日本語特有の利点を使えて、便利で構文木を構築する方法。

4.           構文木の照合アルゴリズム。これにする論文はEfficient retrieval of tree translation examples for Syntax-Based Machine Translation,この文は最もみづらい、定義が多い。でも、この文は最も詳しく、とても勉になりました、この文をみ終わる時。解のうえに、擬似コドも提供しました。最初はInclusion DAGを紹介し、この方法は最もわかりやすい、わたしに良い印象をした。でもさすがにこれは非現的。構文木は必ず下(葉)から纏めて分析する、理由は上のnode際には際の情報は持っていない、ただの論理ノド。ですから、作者はpostorder traversal,pruning non-maximal treelets方法を紹介した、非常に辻褄が合ってきる。最後、複度(complexityを述べた。

 

わたしの究計

わたしは最後の翻部分に勤めたいと思います。詳しく話してみると。

1.自動翻の適する場。

、芸術、哲、詩、歌およびいろいろ。こういうカルチャや感情を膨大に含むんでいるものはさすがに現段階では自動翻は無理がある。また、が多い文章、絶の正確率が求めされる。なおう、がオリジナルを見たほうがいい、自動翻は適するとは考えにくい。ですからわたしの考えによると、自動翻は一般人にして一般の話を翻する。具体的言うと、もしもわたしは日本語ができないならば、わたしは日本のアニメやゲムを遊んでいるとき、理解できない部分がある。このとき、門家を求めると、金がかかる、そして面倒がおおい。自動翻は大適切。わたしは日本の新聞を見ると、NHKのサイトで日本語がわからない、自動翻はとても便利。ですから、自動翻必ず正確に翻すること意味はない、その言葉の大体の感じや場の空えたら、十分と思う。たとえば、                    I have a red bag.a. わたしは鞄がある赤い b.わたしは鞄がある。どちらがよいのか、普通の人にして、必ずb.人は普段その情報の正確度より、その言葉の流ちょうさを先に重視する。

 

2.自然語言とプログラムの語言は大きく違えがある。ですから、コンパイル原理で自然語言に通すわけがない。問題点は以下です。コンパイル原理を利用するのは有益だと否定はしない。

a.言葉の背景や場の空めない。原因はⅰ自動翻は言葉の感情が分別できないⅱこの言葉は何があるのかわからない、新聞の中?アニメで中?老人から?女の子から?

ですから、この情報はが提供すべきだ。詳しいは後で言う。たとえば、

(アニメ「わたしの妹はそんなにかわいいわけがない」10話最初から)

妹のパソコンでエロサフィンなんて、超あり得ないし。

「つんでる。アニメ」

Use the imoto’s computer to eroi-surfing,Really too impossible!

[日本のアニメ文化は外に純分わるせいで、eroiimotoと言う念はある、フランスのサイトで日本アニメは流出、フランス人の翻英語化は以上]

もしこの言葉は「的、面目」とつけられたら(然日本人はこの言葉は決して面目の場いう話ではない、「なんて」「し」とかいろいろの側面からみると、でもパソコンは分別にくい)翻できないわくがない、面目の感じは:

It is impossible that someone use the sister’s computer to eroi-surfing.

b.言葉の誕生は、人が自分の感情を表現するための武器だ。ですから、言葉のなかは各自民族特色の文化やその習慣をく感じられるに違えはありません。日本人のムはたとえ英語バジョンでも、聞く途端で、それは英語の感じではないと判できます。アメリカ人のゲムたとえ日本語バジョンがあると、常に「こんれは日本語だろうか、違和感を抱く」

問題点はそもそもオリジナルのシナリオは他の語言に向いてない。ですから翻には無理がある。そして日本語は粘着型語、その曖昧さもこのおかげだ。Eg.

これは象かもしれない

This is possibly elephant

日本人は確認しないとき、最後で言う。ですから、話の突端以前言ったことは全て否定することは可能。でも、英語は言うまいに肯定や否定を確認しなければならない。でも必ずしもそうでもない、ですから、プログラムで纏めるのは至難。

 


路过

雷人

握手

鲜花

鸡蛋

全部作者的其他最新日志

  • 3
  • 1

评论 (0 个评论)

小黑屋|萌子岛

GMT+8, 2025-2-3 04:58 , Processed in 0.036679 second(s), 20 queries , Gzip On, MemCache On.

Copyright 2020  atollmoe©.a2.1.0 All rights reserved. 9+

Copyright 2009  supported by zhixuan© oeo© oko© All rights reserved.Thank you!

返回顶部