2013年8月7日水曜日

epubで論文(2) Kindleバージョン

今年の初めごろにPMCでダウンロードしたepub形式の論文をブラウザで読んでみたことを書きました。(こちら)

そのときは電子書籍リーダーを持っていなかったので、PC上で読んでみたんですが、最近Kindle Paperwhiteを買ったので、そちらでepub形式の論文を表示させて見ました。

-

まずepubの論文をPMCからダウンロードします。
今回は、こちらの論文( Drummond et al. 2006)を使うことにしました。選んだ理由は有名な論文であることと、複雑な図表や数式が入っていることです。

Kindleは独自のmobi形式の電子書籍ファイルしか読めないので、まずepubをmobiに変換します。ここではcalibreという電子書籍管理ソフトを使いました。読み込んだepubファイルをクリック1つでmobiに変換できます。

mobi形式に変換された論文のファイルはAmazonの"send to kindle"サービスを使ってKindleに送ります。xxxx@kindle.comというメールアドレスにmobiファイルを送ると自動でライブラリにファイルが追加され、自分のKindleに自動でダウンロードされます。全部自動です。

epubをダウンロード→mobiに変換→Kindleに送る、というステップが多少面倒ですが、基本的にはとても簡単です。

Kindleにダウンロードしたものがこちらです。(以下の画像内の文章、図は全て Drummond et al.(2006) のものです)









そして本文はこんな感じです。









フォントや行間隔を調整すればかなり読みやすくなります。PDFの論文のように画面全体を見ることが出来ませんが、ただ読むだけならこれで充分だと感じます。

数式を表示させてみると...









...これはちょっと微妙な感じです。画像として埋め込まれていると思われる数式はちょっと小さすぎます。文章内の数式は少し崩れていますが、こちらは許容範囲だと思います。他のepubファイルで試したところ、数式を綺麗に表示できるときと、できないときがありました。原因はよくわかりません。

次は図ですが...









小さい文字はかろうじて読めるといったところです。小さすぎる数字は読むのがかなりしんどい感じです。色が使われている部分は濃淡があまりはっきりしないので、少し見づらいと思います。紙に印刷したものと比べると多少見劣りします。

-

全体的に、論文の文章部分はかなり読みやすいと思います。文章の多い論文はプリントアウトせずにKindleで読んでも事足りるかもしれません。一方で、数式が上手く表示されないときがあったり、図表が少し見にくかったりするので、普通の研究論文をKindleだけで読むのは少ししんどいかもしれません。複雑な図はPDFかPCのepubリーダーを使わないと何が描かれているのかわからないと思います。

上の論文以外にもいくつかの論文を読んでみましたが、現時点でKindleでepubの論文を読むのは不可能ではないと思いました。でも、図表を大量に使った論文を読むのはかなり大変です。一方でレビュー論文のように文章の多い論文はKindleでも上手く読めると思います。あるいは、論文の中に何が書いてあるのかを流し読みするようなことにも使えるかもしれません。

技術的にはまだまだ発展の余地があると思いますが、将来epub論文を専用のリーダーで読むのが主流になるかどうかはまだわからない、といったところだと思います。

2013年8月3日土曜日

[論文]謎の巨大ウイルス

一般向けニュースでも紹介された新種の巨大ウイルスについての論文を読んでみました。

Pandoraviruses: Amoeba Viruses with Genomes Up to 2.5 Mb Reaching That of Parasitic Eukaryotes
Philippe et al. (2013) Science

ニュースのほうは例えばこちら。(論文がオープンアクセスではないので)
パンドラウイルス、第4のドメインに? ‐ ナショナルジオグラフィック ニュース


ニュースでも紹介されている通り、今回発見されたPandoravirus salinusはゲノムの大きさが250万塩基対と通常のウイルスより遥かに大きく、ゲノム上の遺伝子の大部分が未知、ということです。

もう少し詳しく論文を見ていくと、いかにこの新種のウイルスが不思議な生物(?)であるかがわかります。

-

Pandoravirus salinusはチリの海底の泥の表面に住むアメーバの中から見つかりました。(もう1種のPandoravirus dulcisはオーストラリアの池のなかからです)宿主であるアメーバに寄生すると、自らのDNAをアメーバの細胞内部に放出し、宿主の細胞質内で増殖します。

ゲノムの大きさはおよそ250万塩基対で、推定された遺伝子の数はおよそ2,500です。この値は遺伝子の少ない真核生物レベルの大きさだそうです。

その2,500の遺伝子のうち、わずか186個(7%)しかNCBI(アメリカ国立生物工学情報センター。大規模な遺伝子のデータベースを公開している)のデータベース上で類似のタンパク質配列が見つかりませんでした。それ以外の93%の遺伝子はこれまで一度も見つかっていないタンパク質をコードしていると考えられます。またデータベース上で類似したタンパク質が見つかったもののうちのいくつかは宿主であるアメーバの配列に似ており、おそらく宿主から取り込んだ遺伝子ではないかと思われます。

これらの未知の遺伝子の機能を配列のモチーフや立体構造を用いて推定した結果、ATPの合成やタンパク質の翻訳といった機能を持つ遺伝子は一切見つからず、やはりこの生物(?)が、その大きさに関わらず、ウイルスであることを示しています。

また、Pandoravirusは遺伝子の一部にdsDNAウイルス(二本鎖DNAで遺伝情報を保持するウイルス)と似たものを持っているけれども、その他の遺伝子は普通のウイルスとまったく異なっていたり、本来ウイルスや細菌の遺伝子にはほとんど存在しないイントロン(タンパク質に翻訳されない遺伝子の領域)を持つ遺伝子を持っていたりします。

筆者らは論文の最後で、ある種のDNAポリメラーゼの配列を比較すると、Pandoravirusを含む巨大ウイルスのグループは従来知られた3つの生物のドメイン(真核生物、細菌、アーキア)のどれにも属さないグループを構成することから、第4のドメインが存在しているのではないか、と主張しています。

-

読めば読むほど不思議な生物(?)です。これら巨大ウイルスが第4のドメインを構成するかどうかはまだわかりませんが、生物の未知の多様性を教えてくれる発見だと思いました。

ウイルスの起源や生命の初期の進化について知る重要な手がかりになるかもしれません。今現在、生物は3つのドメインに分類されていますが、もしかしたら将来的にはそれらはより多様なグループの一員に過ぎないことがわかるのかもしれません。