ハイファットマンの友人M

ハイファットマンはおともだちです。ほぼメモ

言語処理100本ノック

言語処理100本ノック(その6)

3章に入りました。 Wikipediaの記事を以下のフォーマットで書き出したファイルjawiki-country.json.gzがある. 1行に1記事の情報がJSON形式で格納される 各行には記事名が"title"キーに,記事本文が"text"キーの辞書オブジェクトに格納され,そのオブジェク…

言語処理100本ノック(その5)

前回の続きから 第2章 15から 15. 末尾のN行を出力 自然数Nをコマンドライン引数などの手段で受け取り,入力のうち末尾のN行だけを表示せよ.確認にはtailコマンドを用いよ. print('自然数を入力') input_num = int(input()) file_list = open('hightemp.tx…

言語処理100本ノック(その4)

前回の続きから 第2章 10から14まで 10. 行数のカウント 行数をカウントせよ.確認にはwcコマンドを用いよ. file = open('hightemp.txt') file_list = file.readlines() print(len(file_list)) # 実行結果 24 # wcコマンドの結果 $ wc -l hightemp.txt 24 h…

言語処理100本ノック(その3)

第1章 06から09まで 06. “paraparaparadise"と"paragraph"に含まれる文字bi-gramの集合を,それぞれ, XとYとして求め,XとYの和集合,積集合,差集合を求めよ.さらに,'se'というbi-gramがXおよびYに含まれるかどうかを調べよ. # 05のを少し変更 def bi_gr…

言語処理100本ノック(その2)

第1章の04と05 04. “Hi He Lied Because Boron Could Not Oxidize Fluorine. New Nations Might Also Sign Peace Security Clause. Arthur King Can."という文を単語に分解し,1, 5, 6, 7, 8, 9, 15, 16, 19番目の単語は先頭の1文字,それ以外の単語は先頭に…

言語処理100本ノック(その1)

Pythonが流行りと聞いたので www.cl.ecei.tohoku.ac.jp $ python -V Python 3.6.1 第1章 00. 文字列"stressed"の文字を逆に(末尾から先頭に向かって)並べた文字列を得よ. print('stressed'[::-1]) # desserts 参考: stackoverflow.com 01. 「パタトクカ…