字幕検索
Elasticsearch の全文検索を使ってみたくて、字幕データ (.ass 形式) を Elasticsearch に入れてみたら楽しかった。 https://github.com/eagletmt/eagletmt-recutils/tree/master/caption-search
TS からの字幕抽出は assdumper でやってる (これまだ若干バグってて字幕テキストの最後に変な文字が入ったりしてる……)。
最初は各字幕の開始時刻・終了時刻も入れてたけど、それを知ってもあんまり嬉しくないと思って、字幕は単なるテキストとして入れた。 自分は kaede を録画システムとして使っていて、これをそのまま使えばタイトルやサブタイトルがファイル名に入るので、ファイル名と字幕テキストさえあれば十分だと思い、それしか Elasticsearch に入れてない。
自然言語処理技術とか検索技術とか全く知らないけど、日本語テキストがいいかんじに検索可能になって Elasticsearch + kuromoji 便利だった。 あと U 局アニメも字幕つけてほしい。
Linux デスクトップセットアップトラブルシューティング
最近クリーンインストールしたときに遭遇してちょっと手間取ったやつです。
X 動かすのに何インストールすればいいんだっけ
xorg (group), xorg-xinit, xf86-video-intel (intel-dri)
ターミナルで ASCII 文字も全角幅で表示される
ロケール (LANG) が ja_JP.UTF-8 になってない
ターミナルで▽とか☆とかがつぶれて表示される
UTF-8-CJK の設定し忘れ、ロケールの設定し忘れ https://github.com/eagletmt/misc/blob/master/ruby/ambiwidth.rb
uim を入れたのに C-j がきかない
gtk-query-immodules-2.0 --update-cache
bluetooth の設定の仕方忘れた
bluetoothctl
でペアリング。udev の rule を書いて起動時に hci0 を開くようにする。
https://wiki.archlinux.org/index.php/Bluetooth
なんかブラウザのフォントのレンダリングが汚ない
fontconfig の設定とか書けばいいんだっけ…?
裸族の集合住宅を買った
ディスクを買い足したくなったので、そのために裸族の集合住宅をついに買った。
センチュリー 裸族の集合住宅5Bay SATA6G USB3.0&eSATA CRSJ535EU3S6G
- 出版社/メーカー: センチュリー
- 発売日: 2013/09/21
- メディア: Personal Computers
- この商品を含むブログを見る
eSATA と USB 3.0 で接続できて、まぁ普通は eSATA で接続したいと思う。 ただし、eSATA を使うにはポートマルチプライヤ対応が必須で (ポートマルチプライヤに対応してないと1つのディスクしか見えない)、そのために玄人指向の SATA3E2-PCIe も買った。
- 出版社/メーカー: 玄人志向
- 発売日: 2009/11/15
- メディア: Personal Computers
- クリック: 4回
- この商品を含むブログ (1件) を見る
わりと定番の組み合わせっぽいけど、Linux でちゃんと動くか不安だった。 とりあえず WD40EFRX を2台挿してみたけど、PC からちゃんと2台とも見えて普通に動いてる。 これらの2台のディスクはなんとなく興味本位で LVM で束ねて1つの大きなディスクに見えるようにしてみて、バックアップ領域として使われる予定。 転送速度も特に問題なさそうで、あとはこの先安定的に動作してくれることを祈ってる。
余談。新しいディスクは普通に ext4 でフォーマットしたんだけど、テストで書き込みを行った後も新規のディスクに定期的に 4MB/s くらいで write があって、iotop で見たら ext4lazyinit だった。 あんまりよく知らないけど、mkfs を高速化するために inode table の初期化を遅延実行するやつらしい。 たしかにディスクサイズに対して mkfs.ext4 は早かった。
追記 2014-07-16
さすがに 4TB x 2 で1つの仮想ディスク作るのはデータロストリスクの観点から狂気だったのでやめた。
あとたまに裸族の集合住宅の電源が落ちる現象に悩んでいたけど、どうやら壊れたディスクを繋いでいて、そのディスクを使っているときに IO Error が発生すると落ちるっぽい。 ディスクを使ってなくても繋いでるだけでもたまに落ちてたけど、もしかしたら smartd によるアクセス起因かもしれない。 とにかく、壊れたディスクを外したら安定したように見える。 SMART のエラーを検知したらすぐに裸族の集合住宅からは外して、直接本体に繋いでデータのコピーをとって捨てるような運用が必要な気がしている。
iPhone 4S から Nexus 5 に移行して1ヶ月ちょっと経った感想
感想
- 端末が大きい
- iPhone は完全に片手だけで操作できたけど、Nexus 5 のサイズになると厳しい
- 慣れてきたけどときどき気になる
- 画面のバックライトの明るさの調整が雑
- ロック画面で見れる通知の情報が少ない
- キーパッドの切り替えが煩雑
- 全般的な操作は快適
- インテント最高
- Linux 環境でも Android アプリは開発できる
- iTunes で買った音楽をどうするのか問題がまだ解決してない
- あとこれから音楽をどこでどう買おう問題も
- iTunes Store 自体は良いので PC とか Android から買えるようになってほしい…
- データ通信を月に1GBもしてないので、ミニマムスタートプランで常にクーポンを ON にしてて平気
- というか500MBも使ってない
- あとはコミケ的な環境でも使えることを期待してる
2014年3月の録画視聴環境
半分自分用のメモです。
ハードウェア構成
http://wanko.cc/machines.html の signum が録画、ストレージ、エンコードのすべての役割を担ってる。
- 録画
- PT2 x 1 (地上波 x 2、BS x 1)
- 分波器とケーブル買えば BS x 2 にできるけど要らなそう
- PT3 x 1 (地上波 x 2、BS x 2)
- PT2 x 1 (地上波 x 2、BS x 1)
- B-CAS カードリーダ
ソフトウェア構成
- OS
- ArchLinux
- ドライバ
- レコーダ
- 録画システム kaede
- 自作 https://github.com/eagletmt/kaede
- しょぼいカレンダー をソースにしてレコーダの起動を行い、前処理を行ってから TS をエンコードキューに入れる
- 詳細は後述
- エンコーダ
録画システム
最近自作し直した。
- レコーダのチャンネルとしょぼいカレンダー上のチャンネルIDの対応表
- 録画したい tid
を設定しておくと、登録した tid の番組を片っ端から録画していくやつ。 「この回は MX で録ったから BS11 の回は録画しなくていいや」とかそういうことはやらないでとにかく録画する。
- updater
- 定期的にしょぼいカレンダーのデータを取得してローカルの番組 DB を更新し、時刻に変化があったら scheduler をリロードさせる (kill -HUP)
- scheduler
- 登録されてる tid の番組の開始時刻に recorder を起動する
- 前のバージョンはこの部分を atd でやってたけど、いろいろつらくなって timerfd で自分で実装した
- recorder の起動前後に好きな処理を追加できる
- 登録されてる tid の番組の開始時刻に recorder を起動する
- recorder
- 録画する
- recpt1 が出力した TS を tail -f して、B25 のデコーダと字幕抽出の2つにリアルタイムにデータを流してる
- まれに B25 のデコードに失敗するので、recpt1 でデバイスファイルから読み込んだデータを一次ソースとしてディスクに保存してから後続の処理に回したいのでこうなってる
今は recorder の前後の処理として、
- 録画前
- @eaglercd へ録画予告ポスト
- 録画後
を行ってる。
視聴
- PC
- iPad
その他
Chinachu がずっと気になっていながらまだ一度も試してない。
拡張可能なプログラム
Ruby のような実行時に何でもできる言語だと、ユーザが書いた Ruby のコードを実行したり、プラグインの gem をインストールするだけで使えるようになったりする仕組みを提供できる。
例えば spring は ~/.spring.rb や config/spring.rb を自動的に読み込み、また spring-commands- で始まる gem を自動的に require し、プラグイン側は Spring.register_command
で独自のコマンドを定義できるようになっている。
- https://github.com/rails/spring/blob/v1.1.2/lib/spring/commands.rb
- https://github.com/jonleighton/spring-commands-rspec/blob/v1.0.1/lib/spring/commands/rspec.rb
pry も似たようなかんじで、~/.pryrc や ./pryrc を読み込んだり、pry- で始まる gem を自動的に require して、プラグイン側は Pry.commands.import
等で独自のコマンドを定義できるようになっている。
- https://github.com/pry/pry/blob/v0.9.12.6/lib/pry/pry_class.rb#L109
- https://github.com/pry/pry/blob/v0.9.12.6/lib/pry/plugins.rb#L70
- https://github.com/deivid-rodriguez/pry-byebug/blob/v1.3.2/lib/pry-byebug/commands.rb#L260
一方、Haskell のような言語だとこういうことをするのは難しい。 Haskell で書かれていて Haskell で拡張可能なプログラムというと XMonad くらいしか思い付かないんだけど、XMonad は「拡張可能なウィンドウマネージャ」というより「ウィンドウマネージャを簡単に作れるライブラリ」に近くて、実際 XMonad の設定は main 関数を持つ普通のプログラムとして書かれる。
XMonad の場合、設定をコンパイルして得たバイナリは ~/.xmonad/xmonad-$arch-$os
に作られるんだけど、xmonad コマンドは ~/.xmonad/xmonad-$arch-$os
を exec し、それに失敗したらデフォルトの設定で xmonad をスタートするラッパーの役割しか持っていない。
Haskell で拡張可能なプログラムとして yi を忘れてた。 yi も XMonad と同じ方式で、設定ファイルは main 関数を持つ普通のプログラムとして書かれるっぽい。XMonad 方式の設定を実現するための dyre というライブラリがあり、yi はこれを使っている。
Haskell で拡張可能なプログラムを書くとしたら、XMonad のようなアーキテクチャにするのがいいのかもしれない。 pandoc は内部では新しい Reader / Writer を追加できるようなアーキテクチャになってるけど、ユーザ側が好きな Reader / Writer を追加できるようなものではなさそう。
ttcoder
大学の ICPC の練習会で使ってる TokyoTechCoder のリポジトリを GitHub で公開した https://github.com/eagletmt/ttcoder
元々オリジナルの TokyoTechCoder があってそれまではそれを使っていたけれども、 それを作っていた人が大学から離れて時間がたってしまったこともあり、メンテがされず動作が怪しいこともあった。 一昨年に半年間くらい初めて Rails アプリケーションを書いてみて、そのときの反省を活かしたい時期だったので、 ちょうど今から一年くらい前に rails new した。 今年度の練習会から新しいものを実際に使うようにして、オリジナルと同じようになるように機能を追加したり、 オリジナルから離れて独自の機能を追加したりしながら現在に至る。
自分もこの春に卒業して社会人になってしまい、このままだと以前と全く同じパターンになってしまうので、このタイミングで公開しておくことにした。 あとまぁ単純にオープンにしておきたいという気持ちもあった。 タダで Travis CI でテストを実行したり Coveralls でカバレッジを記録したりできるし、公開しておくと便利。