1 文から索引語を探す。 単語から索引語 2 (1) 表層語 書いた言葉単語に分けたとき、そのまま表わされているもの。 基本形 単語の一番簡単な形。 読み  表層語を正しい読み方で表している。 発音  単語を人が実際どう読んでるか。 (2) 品詞 単語がどのような種類かをあらわしている。 活用 単語が前に書かれた文などで基本形から、どのように変わったかを表している。 (3) 表層語 (4) tが接続する役目でnが検索の終わりを表している。 =========================================== (1)表層語とは文章を普通に単語分けしたものである。基本形とは単語分けしたものの活用の基本の形をあらわす。読みとはその単語の読み方であり、発音は話し言葉にした形である。 (2)品詞はその単語の品詞名と活用形をあらわしたもので、活用はその文においての活用をあらわしている。 (3)表層語 (4)nが終わりでtが接続詞。 今日学んだことは文章の中から索引語を抽出す方法でYahoo!やGoogleにおいてのしくみも少しわかった。Chasenの使い方や日本語 =========================================== ○今日学んだこと  私は今回の授業で情報検索が検索する情報によって難易が決まるのだと思い、情報検索を行うことには適切な  情報を与えることによって、検索がスムーズに行えるといういことを学びました。 ○課題 例文:クリアを押してから文を入力してください。 (1) ・「表層語」は文を単語に一個ずつに区切るものです。 ↓実証結果↓  クリア  を  押し  て  から  文  を  入力  し  て  ください  。  EOS ・「基本形」は文を単語に一個ずつに区切って、その単語を終止形にする。 ↓実証結果↓   クリア  を  押す  て  から  文  を  入力  する  て  くださる  。  EOS ・「読み」は文を単語に一個ずつに区切って、その単語の読み仮名がカタガナが表示される。 ↓実証結果↓   クリア  ヲ  オシ  テ  カラ  ブン  ヲ  ニュウリョク  シ  テ  クダサイ  。  EOS ・「発音」は文を単語に一個ずつに区切って、その単語の発音がカタガナが表示される。 ↓実証結果↓   クリア  ヲ  オシ  テ  カラ  ブン  ヲ  ニューリョク  シ  テ  クダサイ  。  EOS (2) ・「品詞」は文を単語に一個ずつに区切って、その単語の品詞を表示している。 ↓実証結果↓  名詞-サ変接続  助詞-格助詞-一般  動詞-自立  助詞-接続助詞  助詞-格助詞-一般  名詞-一般  助詞-格助詞-一般  名詞-サ変接続  動詞-自立  助詞-接続助詞  動詞-非自立  記号-句点  EOS ・「活用」は文を単語に一個ずつに区切って、その単語に活用があれば、活用形を表示している。 ↓実証結果↓  (なし)←ここは何も表示されていない。   (なし)  五段・サ行 連用形  (なし)  (なし)  (なし)  (なし)  (なし)  サ変・スル 連用形  (なし)  五段・ラ行特殊 命令i  (なし)  EOS (3) 文章を特徴づけるには、「基本形」が適切だと思います。なぜなら、「基本形」は文を単語に一個ずつに区切って、その単語を終止形にする。単語が終止形で表示されれば、その単語の品詞や活用はある程度まで理解ができると思うからです。 (4) ・「オプション」は「表層語」や「基本形」などの出力フォーマットを表しています。 ○ベクトルの内積  a.b = |a||b|cosθ ○ベクトルの間の角度 cosθ = a*b/|a||b| =========================================== (1)・表層語 文のキーワードとなるもの    ・基本形 単語    ・読み  その文字の読み方    ・発音  声に出して読むときの読み方 (2)・品詞  その単語がなんであるか調べるため    ・活用  その単語がどのように活用しているかしらべるため。 (3)表層語が適切だと思う。 (4)表層語、基本形のオプションを変換文字であらわしているだけ。    だからそこのとこをクリックすると変換された文字でオプションの欄に表示されるだけ。 ========================================== (1)・表層語 文のキーワード ・基本形 単語   ・読み  その単語の読み方 ・発音  その単語の声に出すときの読み方 (2)・品詞  その単語がなんであるか調べる ・活用  その単語がどのような活用をしているか調べる (3) 表層語   キーワードを抜き出すから。 (4)表層語 基本形のオプションを変換文字で表している。  他も一緒。 ========================================= 例文:おはようございます。今日は良い天気ですね。    今日も一日頑張りましょう。 (1)表層語・・・文章の中の単語区切ったのを取り出す。 おはよう ござい ます 。 今日 は 良い 天気 です ね 。 EOS 今日 も 一 日 頑張り ましょ う 。 EOS 基本形・・・文章の中の単語を取り出して、それを終止形で表示する。 おはよう ござる ます 。 今日 は 良い 天気 です ね 。 EOS 今日 も 一 日 頑張る ます う 。 EOS 読み・・・文章の中の単語を区切って、その単語の読みをカタカナで表示する。 オハヨウ ゴザイ マス 。 キョウ ハ ヨイ テンキ デス ネ 。 EOS キョウ モ イチ ニチ ガンバリ マショ ウ 。 EOS 発音・・・ オハヨー ゴザイ マス 。 キョー ワ ヨイ テンキ デス ネ 。 EOS キョー モ イチ ニチ ガンバリ マショ ウ 。 EOS (2)品詞・・・文章の中の単語を区切ったものの品詞を示す。助詞の中にも終助詞とかがあるようにそのようなことも詳しく示す。 感動詞 助動詞 助動詞 記号-句点 名詞-副詞可能 助詞-係助詞 形容詞-自立 名詞-一般 助動詞 助詞-終助詞 記号-句点 EOS 名詞-副詞可能 助詞-係助詞 名詞-数 名詞-接尾-助数詞 動詞-自立 助動詞 助動詞 記号-句点 EOS 活用・・・区切った単語の活用形を示す。 五段・ラ行特殊 連用形 特殊・マス 基本形 形容詞・アウオ段 基本形 特殊・デス 基本形 EOS 五段・ラ行 連用形 特殊・マス 未然ウ接続 不変化型 基本形 EOS (3)基本形、読みが適切だと思う。 理由は (4)基本のオプションは-F[  ]\n"であり表層語の場合[]の中に%mであり、基本形はt%M、読みはt%y、発音はt%a1が入る。 記号の意味はよくわかりませんでした。 今日学んだこと 情報検索の場合、日本語より英語の方が分かち書きされているから検索が簡単であることが分かった。文法情報を出力する機器として茶筅というものがある。 ================================ (1) 表層語 = 解析文を単語に区切ったそのままのもの。 基本形 = 上記の単語の終止形。 読み  = 単語の読み方。 発音  = 単語の発音。 (2) 品詞 = 単語の品詞。 活用 = 単語の活用形。 (3) 基本形 (4) 表層語 = %m 基本形 = %M 読み = %y1 発音 = %a1 品詞 = %U(%P-) 活用 = %T \t%F \n = 終了 ?? \t = & ?? ================================ 情報検索の仕組みをおおまかに知ることができた。英語と日本語では、単語を取り出す時の難しさが全然違うとわかった。 (1) 表層語:入力された文を入力されたままで、単語(?)に分ける。 基本形:表装語の中で終止形にできるものを終止形に変える。 読み:カタカナで読みが出る。 発音:読みでユウセンと出たらユーセンに変える。 (2) 品詞:分けた語の品詞を表示する。 活用: (3) 表層語 (4) ベクトルの内積 2つのベクトルA = (a1, a2),B = (b1,b2) のなす角をθとするとき、 ベクトル、の内積A・Bを次の式で表せる。 A・B = |A|・|B|cosθ = a1b1 + a2b2 ============================= (1)表層語  オプション -F "%m\n" 基本形  オプション -F "%M\n" 動詞を基本形の形にして区切る。 読み   オプション -F "%y1\n" 漢字もひらがなも、すべてカタカナで表示し区切る。 発音   オプション -F "%a1\n" (2)品詞   オプション -F "%U(%P-)\n" すべてを品詞で表示し区切る。 活用   オプション -F "%T \t%F \n" 動詞のみ表示して、その動詞がどのような活用をするか表示する。 (3) 表層語 (4)-F "%m\n"見出し(出現形) -F "%M\n"見出し(基本形) -F "%y1\n"読みの第一候補(出現形)(※ 1) -F "%a1\n"発音全体(出現形) -F "%U(%P-)\n" わからなかった -F "%T \t%F \n" わからなかった ============================ 今日学んだこと たくさんある情報の中から自分の知りたい必要なキーワードを 入力すると、形態素に分け、その文法情報などを出力することがわかりました。 (1) 表層語 入力された文を単語に分ける 基本形 入力された文の単語を終止形にして分ける 読み  読み方が表示される 発音  人の発音の仕方が表示される (2) 品詞  単語それぞれの品詞が表示される 活用形  (3) 表層語 (4) ========================== (1)表層語:表面の層。うわべの語   基本形:折り紙において、その形から複数の折り紙作品がつくり出される汎用性の高い形のことである   読み:文字・文章を読むこと   発音:音声を出すこと。言語音を出すこと (2)品詞:名詞・代名詞・動詞・形容詞・形容動詞・連体詞・副詞・接続詞・感動詞・助動詞・助詞などの11種類の語句   活用:活用は未然形・連用形・終止形・連体形・已然形などがある (3)表層語 (4)特に大した意味はない ======================== (1).表層語・・・・文を単語や助詞ごとに区切る。 基本形・・・・表層語で区切ったものの基本的な形にする。 読み・・・・・表層語で区切ったものの読み方。   発音・・・・・読みを日本人がしゃべる形にする。 (2).品詞・・・・・基本形の品詞   活用・・・・・動詞の活用形 (3).発音 (4).オプションにより様々な形を表現できる。   → →  → →    A・B=|A|・|B|cosθ ========================= 1.表層語・・文を単語や助詞ごとに区切る  基本形・・文の単語や動詞を基本的な形にする  読み・・表層語をカタカナで現したもの  発音・・読みで分析したものをより日本語で読みやすい形にする 2.品詞・・文を品詞ごとに分析する  活用・・動詞を活用形にする 3.品詞 4.実行しているコマンドを現している  →  →  → AB=|A|・|B|cosθ ======================== はちみつが好きで、はちみつのためなら手段は選ばないけど、それ以外の面なら非常に紳士的な人 今日学んだこと 膨大なデータベースからの情報検索処理のメカニズムを少し学んだ。 (1) 表層語 文節ごとに区切る 基本形 単語を終止形にする 読み 読み方がカナで表わされる 発音 発音 品詞 単語の品詞が表わされる 活用形 (2) 品詞 単語を文法上の形態・機能・意味などの上から分類した区分け 活用形 品詞が語形変化したもの (3) 表層語 (4) アドレス =============================== (1)表層語とは、基本形と似ているが、表層の意味から考えてその 単語の深い意味をつかないうわべのものである。 基本形とは、活用で言う終止形のことである。 読みとは、ある単語を読むために必要な方式である。 発音とは、ある単語や言語が発声される方式、 ある人が発声する方法である。 (2)品詞とは単語を文法的な機能や形態などによって分類したものである。 活用とは動詞の語形変化である。 (3)文章を特徴づけるには品詞が重要だと思います。 (4)例をあげると、%mは見出し(出現形)でこれは表層語の時に表示される。 このように、ひとつひとつに対応した変換文字である。 ベクトル問題 内積の計算方法:a・b = |a||b|cosθ ベクトル内積の性質:a =(x1,y1), b =(x2,y2)のときは a・b = x1x2 + y1y2 二つのベクトルの間の角度: a・b cosθ= ----- |a||b| 上記の公式を使い、値を出してから角度に直す。 =============================== (1)  表層語→うわべの言葉? 基本形→基本の形。 読み→その言葉の読み方。 発音→その言葉が発生される方法。 (2) 品詞→単語を文法的な機能や形態などによって分類したもの。 活用→ある言語において述語に立つ品詞に属する語の語形変化のこと。 (3) 品詞が適切だと思う。 (4) 表層語→%m\n 基本形→%M\n 読み→%y1\n 発音→%a1\n 品詞→%U(%P-)\n 活用→%T \t%F \n ベクトルの内積 → →  →  → α・β=|α||β|cossθ ベクトル間の角度の計算     α・β cosθ=--------- |α||β| ========================= 課題 (1)表層語とはうわべの語。 基本形とは何も活用されてないもとの語。 読みとは読みが仮名遣いに基づくもの。 発音とは実際の読み方に基づくもの。 (2)品詞とは単語を文法的な機能や形態などによって分類したものである。 活用とはある言語において述語に立つ品詞(典型的には動詞)に属する語の語形変化のことである。 (3)品詞と活用を用いることで文章を特徴づけれる。 (4)それぞれに対応した変換文字である。 ベクトル問題 内積  a・b=|a||b|cosθ ベクトル内積の性質 a=(x1,y1) b=(x2,y2)のとき a・b=x1x2+y1y2 2つのベクトル内の角度 a・b cosθ= --------- |a||b| =========================== (1)表層語とは、うわべだけであまり意味を持たない文字? 基本形とは、何も活用されていない、付属されていない文字のことである。 読みとは、仮名遣いに基づくものでありカタカナ表記である。 発音とは、実際の読み方に基づき、読みと同様カタカナ表記になっている。 (2)品詞とは単語を文法的な機能や形態などによって分類したものであり、活用とは言語学一般においては、ある言語において述語に立つ品詞に属する語の語形変化のことである。 (3)文章を特徴づけるためには、文章の内容の意味などを表現する役割を果たす、品詞が適切だと思う。 (4)表層語、基本形、読み、発音、品詞、活用を表す変換文字である。 ベクトルの問題 ベクトルの内積 a ・b=|a||b|cosθ ベクトル間の角度の計算 a・b cosθ= ------- |a||b|