未来のいつか/hyoshiokの日記

hyoshiokの日々思うことをあれやこれや

論文100本ノック #東京大学生日記

研究者の卵なので論文をいっぱい読まないといけない。
闇雲に読みまくるとしてもざっくり数量的な目標を持っているといいかもしれないと思い勝手に一人で100本ノックをすることにした。
読んだ論文を紹介するという趣旨の輪講という授業があって、その順番が先日回ってきた。準備をどのようにするか、何の論文を読むか、どのようにまとめるか皆目見当がつかない。
そんなこんなで昨年末ごろから論文を集めて目を通すことにした。今日はそのお話。
紹介する論文は大学院の入試の時に調べた論文を中心に調査することにした。

論文の検索は大学の論文検索システムやGoogle Scholarを使う。
https://scholar.google.co.jp

図書の検索はOPACやカーリルを使う。
https://calil.jp

ある分野を網羅的に俯瞰したい場合は定番の教科書を読むのが一番なのだけどその分野の初学者だとそもそもどれが定番の教科書なのかわからないということがあったり、まるっきり新しい分野だと定番の教科書が存在していない可能性がある。その場合はその分野の専門家に聞けばいい。大学はその分野の専門家がいるので(それを仕事にしているので)、オススメの教科書などを聞いちゃったりする。

コンピュータサイエンスの分野であれば重要な論文は全てオンラインで検索可能なのでGoogle Scholarでざっと関連分野を調べて深掘りしていく。いわゆる人文科学、社会科学系の先行調査はどうやっているのだろうか。図書館を利用するという意味では最初のとっかかりはそれほど違わないのだろうか。

研究者の卵(まだ孵化していない)とはいうもののコンピュータアーキテクチャの定番の教科書は「Computer Architecture, Sixth Edition: A Quantitative Approach (The Morgan Kaufmann Series in Computer Architecture and Design)」というようなことは知っている。第1版の頃からの愛読書だ。

先日ACMIEEE Computer Societyの学生会員にもなったのでそれぞれのDigital Libraryにもアクセスできる。*1

例えば下記の論文を検索してみる。
https://scholar.google.co.jp/scholar?hl=en&as_sdt=0%2C5&q=Staring+into+the+Abyss%3A+An+Evaluation+of+Concurrency+Control+with+One+Thousand+Cores&btnG=

2014年の頃の論文だ。クリックするとACM Digital Libraryにアクセスできる。(会員じゃないとアクセスできないかもしれないけど。)

論文の書誌情報、概要、引用文献(References)、被引用(Cited By)がわかるほかアクセス権があれば全文(PDF)をダウンロードできる。ここまで一切図書館とか行かないでネットだけでできる。自宅からでもスタバからでも大学の図書館からでも、世界中ネットさえあればどこからでもできる。

引用文献もACM関連の論文であればリンクが貼ってあるのでクリックするだけだ。例としてあげた論文は44件の論文を引用していたが、そのうち33件はそのままリンクを辿れば引用文献にたどり着く。その他の引用文献は自分でタイトルをコピペしてGoogle Scholarに突っ込めば検索できる。書籍からの引用に関してはそれにあたる必要はある。

小一時間もクリックしているだけで最初の論文が引用していた論文の8割程度は収集できる。

さらにこの論文を引用している論文も検索できる。この論文を引用しているわけだから、当該論文以降に発表された研究になる(当たり前だけど)。その後の研究動向の流れを理解することができる。

当該論文が重要な論文であれば、多くの論文に引用されて、豊かな水脈を形作るので、被引用数というのは論文の価値をはかる上で重要なファクターになる。インパクトファクターとも呼ばれる。

この論文では43件表示されていてその全てがクリック可能になっている。Google Scholarでは112件と出ている。

この論文を引用している論文のタイトル、概要などを見て興味深いものについては同様にアクセスして収集する。

例えば40本の論文がクリックするだけで収集できるのだけど、自分が学生の頃であれば、図書館にこもって当該論文が掲載されている論文誌を見つけてコピーをとってという作業を延々と繰り返す必要があって、1週間くらいは平気でかかる。被引用論文の場合はさらに手間がかかってCitation Indexという辞書みたいな論文の被引用索引を手繰っていく。重要な論文誌に掲載されていない論文だとCitation Indexに掲載されていないので、そのような論文は発見できないので、論文調査の抜け漏れが発生する。

論文収集の時間的コストは1週間から1〜2時間に劇的に短縮された。すごい。

それはそれですごいのだけど、論文を読む速度とそれを理解する速度はほとんと変化がないので(下手をすると遅くなっている部分もあるかもしれない)、その集めた論文を4週間くらいかけて読むことになる。

論文を読んでいるうちにさらに関連論文に手を出して言って集めるだけはどんどん集まっていく。

そんなこんなの収集フェーズがこの1月である。

その膨大な論文の山の中から輪講で紹介する論文を決めて資料を作成する。

パワポと論文(8ページ)を作ることになる。発表の1週間前にパワポを研究室の人に見てもらってコメントをもらう。

まとめ方も方向もいいのか悪いのかわからないし、どのようなプロセスでそれをやるのか研究科の流儀もわからないので、どのくらいの手間暇、時間がかかるか見積もりができない。いたずらに時間ばっかりがかかる。会社の仕事ならばだいたいこのくらいの時間でこのくらいのことができるかなあというざっくりの見積もりができるけど最初の作業なのでしょうがない。

調査論文はLaTexで作る。MacLaTex環境をインストールした。雛形は研究室の修士の学生さんからもらった。

引用論文はBibTex形式なのだが、当初論文を収集していた時にBibTexも集めていなかったということに1週間くらい前に気がつく。というかTexで論文書かなきゃその必要性もわからない。

ACM Digital LibraryのページにはちゃんとBibTexをダウンロードするボタンがついているのでそれをクリックするだけである。Google Scholarでも同様に書誌情報をゲットできる。

論文数が100本くらいであれば、論文管理ツールなどを使わなくてもどうにかできるがこれからはそれの利用が必要になってくる。学生さんに聞いたところ、エクセルで管理していますとか、Scrapboxですとか色々とあるみたいだ。先日RefWorksというのを教えてもらったのでちょっと試してみたい。

あれやこれやでこの一月で257本ほど論文など、BibTexは75個ほどゲットした。毎日毎日理解できてもできなくても少しづつ論文(博士論文も含めて)を読んでいく。

最低でも月に100本は論文を読む。論文100本ノックである。

*1:日本の学会には(まだ)所属していない。

はてなダイアリーからはてなブログへ移行しました

長らく利用していたはてなダイアリーからはてなブログへ移行しました。それに伴い、ブログのURLも変更になっています。昔の日記からは自動的にこちらにリダイレクトされるような設定になっているようです。

それではこちらでもご愛顧お願いします。(気持ち的にははてなダイアリーのままなので、日記のつもりで書いています)

ネットプリント、ネットワークプリントについて

コンビニで簡単にファイルを印刷できるサービスが便利だ。

大きく分けてセブン・イレブン系(ネットプリント)とローソン、ファミマ系(ネットワークプリント)などでできるのがある。使い勝手が若干違うが、基本的には印刷したいファイルをアップロードして、コンビニ店舗で印刷する、白黒一枚20円だ。文書だけではなくて写真なども印刷できる。

自分は自宅にプリンタを持っていないので重宝している。正月休みは論文を大量に印刷してせっせと読んだ。

セブン‐イレブンで簡単プリント ~ネットプリント(個人のお客様)~
ネットワークプリント|パソコン・スマホから登録、コンビニで印刷

コンビニのコピー機はお札を受け付けてくれないのでレジで1000円札をコインに両替してもらおう。

セブン・イレブンの印刷の場合は、1ファイルごとにプリント予約番号というのを入れて印刷する。複数ファイルを一気に印刷する機能はない。

ローソン、ファミマ系の場合は、ユーザー番号でログインすると印刷するファイルを選べるので複数ファイルを一気に印刷できる。ただ、コピー機のメニューでネットプリント機能を選んでも起動に時間がかかるのでどちらの方式にも一長一短がある。

自宅そばのコンビニを使うのでもいいし、出先でちょっとしたファイルを印刷するのでもいい。利用シーンはいろいろとあると思う。スタバの前のコンビニで印刷というようなことも可能だ。

2019年、あけましておめでとうございます。研究者の卵としての抱負

昨年は還暦で定年退職をして9月末より大学院博士課程の学生になった。今年は研究者の卵として学んでいきたいと思う。

どんなプロジェクトも楽観的に始まり悲観的に終わる。博士号取得のプロジェクトもそんな予感がする。

悲観的に終わらないためにもプロジェクト管理の経験を持ってどうにか対処をしたいと思うのだが、絶対的な能力不足という問題もあるので、それについては地道に網羅的な学習・勉強をしたいと思う。数学の学び直しとか、論文の作成技術の向上とか、あれやこれやである。

リサーチクエスチョンの健全性を担保するために幅広い学際的な議論が必要だと思うのだが、論文を1000本くらい読んでから顔を洗って出直してこい、という気もしなくはない。初学者として学ぶ順序があるのではないかと推測する。

趣味の読書も貪欲に突き進みたい。スゴ本をいっぱい発見したい。日記にも100冊くらいは紹介したい。昨年60冊くらい紹介したので7割増しくらいの分量になる。小説をもっと増やしたいと思う。新しい知識を得るというよりも新しい視点を得るための読書にしたい。

行き当たりばったりの一人旅も行いたい。自動車でアメリカ横断をしたいのだが、時間を取れるか調整したい。

フリーランスとしての仕事は研究に支障のない範囲で行いたいと思う。コラボレーション、仕事の依頼などは連絡してほしい。

人生の壁打ちも必要だと思うので、飲み会などにも積極的に参加したい。(飲まないけれど)。
ランチやお茶飲みなどどんどんやりたい。比較的時間の自由はきくのでお茶などは気楽に声をかけていただけると嬉しい。

1000 speakers conference in Englishは参加者が延べ1000人になるまで続けるつもりなのだが、まだ後600名以上必要なので、皆様の参加を待っている。英語で発表する機会(練習する機会)が必要な人はぜひ参加してほしい。

カーネル読書会というlinuxOSSに関するハードコアな勉強会みたいなものも細々と続けていきたいので参加者募集中だ。

いろいろとやりたいことがてんこ盛りでとっちらかっちゃった印象だけど、ご支援・ご協力よろしくお願いいたします。

研究者の卵としての2018年ふりかえり

2018年は還暦の年だ。
9月に満60歳になり定年退職をした。(9月末で60歳定年退職しました - 未来のいつか/hyoshiokの日記
人生の節目である。そして、それを機に9月末より東京大学大学院情報理工学研究科博士課程に入学し現役の大学生である。
仕事はすっぱりやめた。
人生100年時代、人生二毛作。18歳のつもりで学び直している。数年後に何が起こるかわからない。変化が前提の時代だ。それゆえに自分の知識やスキルをアップデートしておきたい。それが人生を自由に生きるコツだと思う。

学生は自由だ。何を学ぶか、何を学ばないかを選択する自由がある。今日何をするか、何をしないか選択する自由がある。

若い頃はその自由を持て余していた。何に使っていいかイメージが湧かなかった。社会人経験を積み、自分がやりたいこと、やりたくないこと、得意なこと、不得意なこと、社会から期待されていること、期待されていないこと、様々な軸があることを知り、その中で自分を相対的に位置づけることが必要だということを学んだ。

給料をもらうために会社員をやっていると今日やらないといけないことを自分が選ぶという自由はほとんどない。せいぜい、AとBどちらを先にやるかとか、その程度の選択肢でしかない。毎日会社に行って仕事をする。それ以上でもそれ以下でもない。

学生は自由だ。自分の人生を選択する自由がある。

研究者の卵として研究者に必要なスキルを身につけるにはどのようにしたらいいのだろうか?正直よくわからなかった。先行研究の調査はどのようにしたらいいのだろうか?博士論文のテーマはどのように見つけたらいいのだろうか?全く五里霧中であった。

enPiTという前職時代に関わっていたプロジェクトのFD(教員が教授方法について議論する取り組み)合宿が先日あったので大学教員を務める人々に博士課程のことについていろいろと伺った。

何を今更言っているのだ、お前は。という声が聞こえてきそうである。実際、その通りである。しかし、自分は行動してから考えるという方法で人生を乗り越えてきた。Never too late だ。不確実性の時代、あらかじめ計画を立てておくということは不可能だ。

様々な先輩たちに博論で苦労していた時代の話を聞いた。

琉球大学の國田さんから「できる研究者の論文生産術 どうすれば「たくさん」書けるのか (KS科学一般書)」をオススメされた。

これは自分も実は読んでいて、『学術書を書く』、『できる研究者の論文生産術 どうすれば「たくさん」書けるのか (KS科学一般書)』読了、濫読日記風、その11 - 未来のいつか/hyoshiokの日記で紹介している。

「できる研究者の論文生産術 どうすれば「たくさん」書けるのか」は米国の心理学者がいかに多量に論文を書くかというノウハウを記したものだ。
第2章がすごい。言い訳は禁物ー書かないことを正当化しないとして、「書く時間が取れない」「もう少し分析しないと」「文章をたくさん書くなら、新しいコンピュータが必要だ」「気分が乗ってくるのを待っている」などなどの書かない言い訳、書けない言い訳をあっさり粉砕している。
毎日執筆時間を決めて、その時間には執筆に専念しろという。毎日書く。それだけだという。
これは間違いなく正しい。正しいことだけど、作文技術の教科書にはおそらく誰も記していなかったことなのではないだろうか。画期的だ。騙されたと思って読んでほしい。すごい本だ。
東大生はこんな本を読みながら研究して論文を多数発表して学術書を書いているのだろうか。それができれば苦労しないという声が聞こえてきそうだが、それができない人は研究者にはなれないのだろうなあとも思った。いやはや身も蓋もない。

できてもできなくても毎日毎日論文調査をする。

大学院試験の口述試験の時に使った自己紹介(?)のスライドを見直して、引用した文献を再度調査することにした。それが載っているProceedings、その論文を引用している論文、その論文が引用している論文、専門分野のトップカンファレンスで発表されている論文などを調査することをとっかりとした。

4ヶ月前の自分に助けられた。とっかかりの論文は自分が発見していたではないか。1年半前の自分に助けられた。研究者になるためには、言い訳をしてはいけないということを知識として得ていたではないか。それができていなかっただけだ。

できてもできなくても毎日毎日論文調査をする。

最初の一歩を踏み出せた気がする。

まとめ、濫読日記風 2018、その63

2018年も濫読した。年初には50冊くらい紹介できればいいかなと思っていたのだが、10月末の段階で濫読日記風はその15までしか行ってなかった。(ゲーデルエッシャー、バッハを除けば60冊紹介したことになる。)

濫読そのものは続いていたので、はてな日記に書くのが滞っていた。図書館で借りて感想を記さなかった本もいくつかある。読了した時点で、短くてもいいので簡単な感想を記しておくべきだなと思った。流石に半年どころか一月も経つと何を読んだかすっかり忘れているので記憶を定着させる意味でもすぐに書くのがいい。

図書館の本はパラパラめくる系で熟読したり読了したりしないものも少なくないので、それも何らかの形で感想を記すのもいいかなと思った。

読書に対してはもっと色々なアプローチがある。

この日記は自分のために記しているので、本の紹介といっても新刊の書評サイトという風ではなくて、あくまで自分向けの備忘録である。

とはいうもののせっかくなので今年紹介した本の中で印象に残った本をいくつか選んでみたい。

今年も小説やら技術書やらビジネス書などジャンルを問わず濫読した。本当はもっと文学を読みたいのだけど、長編は時間がかかるので読了数を稼げない。

ハックルベリーフィンの冒険」*1は面白かった。今読むと酷い話というのは古典を読むとよくあることで、本書もエピソードは酷いのだけど、ハックのサバイバル力がなかなか痛快だった。

「幽霊たち」*2柴田元幸訳で面白かった。今年は柴田訳を色々と読んだ一年だった。

「大いなる眠り」*3村上春樹訳だ。自分にとって初レイモンド・チャンドラーだ。主人公「フィリップ・マーロー」は33歳独身である。モテる。他の作品も読んでみたいと思った。

技術書は大して読んでいないが一押しは「RISC-V原典」だ*4。多くの人にとってコンピュータアーキテクチャは興味の中心でもないだろうし、仕事に直接関わることも少なそうだ。だからこそ教養としてRISC-Vについて知っておいてもいいと思うが、余計なお世話である。

ノンフィクションの近刊で面白かったのは「花殺し月の殺人」*5だ。事実は小説より奇なり。西部劇ではインディアンは悪者だが事実は逆だ。白人が悪事を尽くす。

歴史関連では「歴史とは何か」*6、「歴史の進歩とはなにか」*7が面白かった。史観では「情報の文明学」*8が21世紀の情報化時代にこそ再評価されるべきだと思った。「銃・病原菌・鉄」*9をひとことで表すならば「歴史は、異なる人々によって異なる経路をたどったが、それは、人々の置かれた環境の差異によるものであって、人々の生物学的な差異によるものではない」ということらしい。従来の西洋史観が強奪者・殺戮者のものだったことを考えると随分と進歩したものだ。「MARCH非暴力の闘い」*10は1960年代米国公民権運動の当事者の物語だ。

産業化社会が製造業を中心とした企業群から情報産業に移行していく。「EVと自動運転」*11自動車産業が100年に一度の変化に直面していることを示している。製造業はビジネスモデルの変化に対応できるだろうか。

失踪日記2アル中病棟」*12インパクトがあった。アル中で入院するというのもすごいが数々のエピソードがすごい。自分はアル中にならないでよかったとおもった。

「自由と規律」との出会いも不思議な縁であった。イギリスの全寮制パブリックスクールの物語だ*13。東北への旅に出て本書に出会った。岩波新書のおかげで父と対話できたような気分だ。

まだまだ読んだ本について語りたいことがあるが長くなりすぎたのでこのくらいにする。

読書会

今年は読書会をきっかけに様々な本とであった。

読書会という形式も様々ある。1)課題図書をみんなで読む、2)自由に紹介し合う。

1)の課題図書をみんなで読むというのは、担当者を決めてそのひとが担当部分を解説し、議論するという形式もあれば、全員で読了して、読了を前提として議論するという形式もある。

前者は担当部分を解説するのでしっかりと読み込んでいないといけないので、その部分の理解が非常に深まる。自分も主宰者の一人の「ゆるゆると『ゲーデルエッシャー、バッハ』を読む会」(ゆるげぶ)はその形式であり、勢いが余って『ゲーデルエッシャー、バッハ』を楽しみながら紹介する『ゲーデルエッシャー、バッハの薄い本』なるものを製作してしまった。技術書典にも出展して同人作家デビューを果たした。

後者の読了前提の読書会は、小説を読んでみんなであーだこーだ感想を言うものから、一般書(技術書やビジネス書)を読んで議論するものなど幅広い。本の数だけバラエティーがある。ドストエフスキーの5大長編は読書会があったので、それをきっかけに読了した。FEDという読書会もこの形式が多い。

課題図書は課題図書として作者の招いてのイベントや特に読了を前提としないでセミナー形式なものもある。

2)の自由に紹介し合うと言う形式は、ビブリオバトルのように本を紹介して、どれだけ読みたいと思ったかを投票するものや、単に自分の好きな本を持ってきて語るものまで様々だ。

日頃自分が絶対手に取らないような本が紹介されるので読書の幅が広がるメリットがある。

課題図書を読む形式だと、他人の読み方や解釈を聞けるので自分の読み方や視点との違いがわかって自分の読み方の幅が広がる。マルセル・プルーストは「本当の旅の発見は新しい風景をみることではなく、新しい目をもつことにある。」と言ったそうだが、読書によって新しい目を持つことができれば僥倖だ。

読書会をすることによって自分の読み方を広げるメリットは大きい。

論語の読書会は、岩波文庫論語」を読むのだけど、「子(し)の曰わく(のたまわく)、学びて時にこれを習う…」をひと段落ひと段落音読するという形式である。この素読の読書会に参加して初めて読書の身体性を意識した。何だかよくわからないけど、音に出して読む。同じ部分の日本語解説も音読する。「先生が言われた。学んでは適当な時期におさらいをする、…」。それを繰り返す。時間はかかるが読書を味わう感覚がある。

この素読という方法によって自分の読み方が広がった感覚を持った。

論語の読書会の素読の経験がなければ「蘭学事始」の理解も随分浅いものになっていたのではないかと想像する。

数学系の本などもじっくり読んでみたいと思う。ゆるゆると難読書を読む会(ゆるめな)をゆるげぶをやった白石さんたちとやっているところである。

濫読日記風 2018

*1:ゲーデル、エッシャー、バッハ、第20章、六声のリチェルカーレ、訳者あとがき、訳者紹介まで読了、ダグラスRホフスタッター著、濫読日記風 2018、その15 - 未来のいつか/hyoshiokの日記

*2:幽霊たち(新潮文庫)、ポール・オースター著、柴田元幸訳、読了、濫読日記風 2018、その37 - 未来のいつか/hyoshiokの日記

*3:大いなる眠り (ハヤカワ・ミステリ文庫)、レイモンド・チャンドラー、村上春樹訳、読了、濫読日記風 2018、その50 - 未来のいつか/hyoshiokの日記

*4:RISC-V原典 オープンアーキテクチャのススメ、デイビッド・パターソン&アンドリュー・ウォーターマン著、成田光彰訳、読了、濫読日記風 2018、その58 - 未来のいつか/hyoshiokの日記

*5:花殺し月の殺人――インディアン連続怪死事件とFBIの誕生、デイヴィッド・グラン著、読了、濫読日記風 2018、その25 - 未来のいつか/hyoshiokの日記

*6:歴史とは何か (岩波新書)、E.H.カー著、清水幾太郎訳、読了、濫読日記風 2018、その52 - 未来のいつか/hyoshiokの日記

*7:歴史の進歩とはなにか (岩波新書 青版 800)、市井三郎著、読了、濫読日記風 2018、その54 - 未来のいつか/hyoshiokの日記

*8:情報の文明学 (中公文庫)、梅棹忠夫著、読了、濫読日記風 2018、その53 - 未来のいつか/hyoshiokの日記

*9:銃・病原菌・鉄、ジャレド・ダイアモンド著、読了、濫読日記風 2018、その12 - 未来のいつか/hyoshiokの日記

*10:MARCH 非暴力の闘い、ジョン・ルイス著、読了、濫読日記風 2018、その23 - 未来のいつか/hyoshiokの日記

*11:EVと自動運転、鶴原吉郎著、読了、濫読日記風 2018、その19 - 未来のいつか/hyoshiokの日記

*12:失踪日記2 アル中病棟、吾妻ひでお著、読了、濫読日記風 2018、その13 - 未来のいつか/hyoshiokの日記

*13:自由と規律、池田潔著、濫読日記風 2018、その6 - 未来のいつか/hyoshiokの日記

マイクロソフト 再始動する最強企業、上阪徹著、読了、濫読日記風 2018、その62

マイクロソフト 再始動する最強企業を読んだ。

GAFA(Google/Amazon/Facebook/Apple)という言葉がある。初の1兆ドル企業となるのはどの会社か。この四騎士に続く企業は何か?中国系企業か?それとも新興のネット企業か?

マイクロソフトはその候補の一つである。

創業社長(ビル・ゲイツ)は早々に引退しているが(急成長している企業の多くはAppleを除けば創業社長が実権を掌握して迅速な経営をしている)、三代目CEOサティア・ナディアはビジネスモデルを変え圧倒的な存在感を示している。時価総額も一時期Appleを抜いた。

日本では古いイメージしか知られていないが本書は最近のマイクロソフトの強さを紹介している。


濫読日記風 2018