yetnoneの日記

どこぞのPh.D. student。何をやっているかと聞かれると困る。

Wordに貼り付けたPDFがベクトル形式ではなくなってしまう現象

タイトルの通り。外部のPDFからWordに貼り付けたPDFは、大抵はそのままベクトル形式で配置され、拡大・縮小しても綺麗なまま保たれる。

しかし、たまにこれがうまく行かず、貼り付けたその時点は綺麗に写っているものの、一度ファイルを閉じて再度開くと(!)荒くぼやけたサムネイルになってしまうことがあった。

色々試してみて分かったことは以下の通り。

  • ある特定のPDFファイルをIllustrtorを使って編集すると起こる(AcrobatKeynoteで編集すると大丈夫だった)
  • それぞれを別々に貼り付けても大丈夫だったものが、複数を(Illustrator, PowerPoint, Keynote等で)1枚のPDFにまとめてから貼り付けるとダメ
  • PDFを経由しないでPowerPointオブジェクトを貼り付けるとうまくいく

結局解決できずPowerPointからオブジェクトを直接コピーして貼り付けることにしたのだが、謎すぎる。Wordが勝手にサイズを圧縮していると思ってそれ関連と思われる色々な機能をオフにしてもダメ。

普段はWord (というかOffice全体)なんて使わないのだが、今回は様々な兼ね合いで使わざるを得ず仕方なくdocxを用意した。途中、何度嫌になったことか。。この手のソフトウエアは、便利さを謳いながら、その実制限された機能を詰め込んでいるだけで、自由度が低く結局やりたいことなんかできないというのが個人的な印象だ。タダ飯は無いのである。

2017/5/22追記

おそらく原因が判明したので追記。Keynoteからオブジェクトをコピーする時に、どうやらベクトル形式のオブジェクトであってもラスター形式でクリップボードに保持されるらしい。。

以前はベクトル形式のままできたと思うのだが(ググるクリップボード経由でpdf保存みたいな記事がいくつか出てくる)。。。

PowerPointは大丈夫。謎仕様だ。Keynoteの株は自分の中で大暴落。(2017/7/5追記: どうやらこのKeynote由来の現象は全体の一部らしく、Keynoteを使わなくても起こるらしい。昔のMavericksとかも引っ張り出して近いうちに原因をちゃんと調査したい。)

今まで図を書くときは基本的にRを使っていた。しかし、言語仕様のせいかライブラリのせいか、Rはなんとも言えない使いにくさがある。

ちょうどベン図を描きたいと思っていた。ベン図なんて表現としては基本中の基本だから、いくらでもライブラリが転がっているだろう。そう思っていた。

しかし、蓋を開けてみると、ライブラリがいくつかあることにはあるのだが、どれも使ってみると納得いかない。

  • PDFで保存できない
  • 大きさを集合の要素に合わせてスケールできない
  • 色とかの自由度が低い

等々。

そこで、じゃあそこらへんのwebサービスでも使ってみようかとググってみると、これまた使いにくい数々のツール達が。古くて汚い画像しか出力できないもの、スケールしないもの、そもそもUIが煩雑、(濃度の指定だけではなく)集合を直接指定しないといけないもの、等々。。。

正直かなりうんざりしていた。だがその時、ふとpythonのことを思い出した。自分はこれまで、python ユーザにはおなじみのはずであるmatplotlibを全くといっていいほど使ってこなかった。謎である。

結果として、matplotlib_vennのvenn2で非常に満足のいくベン図が書けたという、それだけの話。しかし、Rは可視化ツールとしてだけ使うのはちょっと面倒だし、Javascriptを持ち出してくるのは大袈裟な感じがするし(加えて大体面倒だし)、pythonの手厚いサポートを受けたmatplotlibは便利だということに(今更)気がついたので、今後はRからこっちに切り替えていきたいと思う。

画像の一部分の比較

画像処理というには簡単すぎる内容かもしれないが、画像の一部分を切り出してすでにあるものと比較、という処理。最近やっていないのにブックマークが邪魔だったので、ここにまとめようと思い立った。

簡潔にまとめると以下の通り。

画像切り出し

  • $ convert -crop 横ピクセル数x縦ピクセル数+横始点ピクセル+縦始点ピクセル 元画像 出力画像名
    • 例: $ convert -crop 960x720+160+0 src.png dest.jpg
    • ピクセル指定のところは代わりに50%のような割合指定も可能

画像比較

  • $ perceptualdiff -threshold 閾値ピクセル数差 画像1 画像2
    • 例: $ perceptualdiff -threshold 100 fig1.png fig2.png

参考文献

programmer-jobs.blogspot.jp

画像比較 with perceptualdiffkazucocoa.wordpress.com

Macにpython 2とpython 3を共存させる

文字列の扱いとかprintの関数化とかで個人的に好きなのはpython3だが、python2も使えた方が良いだろうと思い、よく知られているpyenvを導入。今後も使いそうなのは以下のコマンドか。

  • $ pyenv versions
    • これまでにインストールしたバージョンの確認
    • systemMacに最初から入っているpythonインタプリタで、他のバージョン数字がpyenvで入れたもの
  • $ pyenv install --listもしくは-l
    • インストール可能なバージョンのリストを表示
  • $ pyenv install バージョン名
    • バージョン名とは上のコマンドで表示された名前のこと
  • $ pyenv global バージョン名
  • $ pyenv rehash
    • バージョン変更したらこれを実行

関係ないんですが、コマンドの説明をする時に変数(ユーザによって入力が変わる部分)をどう表現するかによく困るんですが、英語斜体とか大文字よりも日本語で書くと分かりやすいと個人的に思うのですが、どうなんでしょうか。統一的な記法とかあれば知りたい。

参考文献

qiita.com

qiita.com

Rust

最近流行っているらしいRustの解説動画。半分くらいまで視聴。

Ownership/Borrowingという概念でポインタ周りの(潜在的)バグをコンパイル時に見つけたりできるようにしたらしい。発想としてはshared reference (SR; 共有参照?不変参照?とでも言うべきか)/mutable reference (MR; 可変参照?とでも)をうまく使い分けることでC++では未定義動作だった解放済みのアドレス参照を防いでるようだ。1つのオブジェクトに対してshared/mutableを同時に両方は使えないようにして、オブジェクトの参照と変更がお互いを気にしないで行われることを防いでいる(と自分は受け取った)。

また、Ownership概念を使うと、スレッドのmutationを明示的に行わなくてもよくなる?(Ownershipは非同期なスレッドであっても同時にはどちらか一方にしか与えられないから)。いちいちOwnershipのやり取りをしないといけないので実行速度が少し気になるが、どうなのだろうか。

そもそもOwnershipがどのようなものか、どのように付与しているのかがまだよく分かっていないので、機会があれば使用を検討して実際に使いながら理解していきたい。

英語学習

英語力を向上させたい。ので、以下の方針で鍛えていこうと考えている。

  • VoiceTube
    • 和訳付き動画
    • TEDやCNN 10も包含していて、洋楽もあるらしい
    • 現状での有力候補少し使ってみたが、かなり良い。TEDを英語+日本語字幕で見られたり、speakingやディクテーションのクイズもあってオールインワンという感じ。

jp.voicetube.com

  • Voice of America
    • アメリカ英語を原稿付き+ゆっくり発音で聞ける

learningenglish.voanews.com

  • English Listening Lesson Libary Online
    • 音声や動画でのレッスンが豊富らしい

www.elllo.org

  • Listen and Write - Dictation
    • ディクテーションの練習ができるらしい

www.listen-and-write.com

* Lang-8 * 外国人と文章の相互添削ができるらしい * 相手もユーザーなので正確ではない可能性がある lang-8.com

-> 現在はHiNativeというサービスに移行しているらしい。が、そちらがどうにも微妙そう(機械翻訳精度が上がれば不要になりそう?)なのでおそらく使わないだろう。

hinative.com

  • Sciwrite Stanford
    • 科学論文の書き方
    • 説明そのものについてもyoutubeの字幕生成が使える

www.youtube.com

参考文献

www.stay-minimal.com

‘Mobilome’ Study of Antibiotic Resistance Implicates Transposon Activity

www.pacb.com

PacBioで高品質なプラスミドのアセンブリ -> 抗生物質耐性遺伝子(ARG)のより良い特徴付け -> ARGの細菌間伝播メカニズム解明、という話。対象としている細菌はNIHで単離培養されたEnterobacteriaceae。Susu Heさんがリーダー。

  • 感染が広がった細菌を数年間に渡ってシークエンシングして、プラスミド中のtarget site duplication (TSD; ゲノム中のある特定のコンテキストにtransposable elementが挿入されること)を追跡した。

https://image.slidesharecdn.com/bacterial-transposons-1235039960223797-2/95/bacterial-transposons-26-728.jpg?cb=1235018415

(https://www.slideshare.net/guest06ad101/bacterial-transposonsより引用)

  • ARGに対抗する手段が見つかる、、かもしれない。

  • PacBioのmultiplexed sequencingを使えば非常に安価にどんどん読めるだろう。

ファージやプラスミドは最近流行りつつあるように思うので、自分の論文も通るといいな。。