池袋バイナリ勉強会(8)に参加しました
11月25日(日)に開催された池袋バイナリ勉強会(8)に参加しました。PDP-11のバイナリ解析に取り組んでいます。a.outを逆アセンブルする自作スクリプトを作成しながら、平行してそれを実行するインタプリタを作ろうとしている段階です。
逆アセンブラの作成
以下のhello.cを逆アセンブルするプログラムの作成に取り組んでいます。
$ cat hello.c main() { write(0, "hello\n", 6); }
たったこれだけのコードですが、hello.cから生成されるa.outをpdp11-aout-objdump
で逆アセンブルしてみると、いろんな処理が行われているのが分かります。逆アセンブル結果が以下になります。
$ v6cc hello.c # コンパイル $ v6strip a.out # シンボルテーブル削除 $ pdp11-aout-objdump -d a.out # 逆アセンブル a.out: ファイル形式 a.out-pdp11 セクション .text の逆アセンブル: 00000000 <.text>: 0: f009 setd 2: 1180 mov sp, r0 4: 1226 mov (r0), -(sp) 6: 0bd0 tst (r0)+ 8: 1036 0002 mov r0, 2(sp) c: 09f7 0008 jsr pc, 0x18 10: 100e mov r0, (sp) 12: 09df 0052 jsr pc, *$122 16: 8901 sys 1 18: 0977 0040 jsr r5, 0x5c 1c: 15ce 0006 mov $6, (sp) 20: 15e6 0086 mov $206, -(sp) 24: 0a26 clr -(sp) 26: 09df 0030 jsr pc, *$60 2a: 2596 cmp (sp)+, (sp)+ 2c: 0077 003a jmp 0x6a 30: 1166 mov r5, -(sp) 32: 1185 mov sp, r5 34: 1d40 0004 mov 4(r5), r0 38: 1d77 0006 0052 mov 6(r5), $0x90 3e: 1d77 0008 004e mov 10(r5), $0x92 44: 8900 sys 0 46: 008e .word 216 48: 8602 bcc 0x4e 4a: 0077 002a jmp 0x78 4e: 1585 mov (sp)+, r5 50: 0087 rts pc 52: 1166 mov r5, -(sp) 54: 1185 mov sp, r5 56: 1d40 0004 mov 4(r5), r0 5a: 8901 sys 1 5c: 1140 mov r5, r0 5e: 1185 mov sp, r5 60: 1126 mov r4, -(sp) 62: 10e6 mov r3, -(sp) 64: 10a6 mov r2, -(sp) 66: 0be6 tst -(sp) 68: 0048 jmp (r0) 6a: 1141 mov r5, r1 6c: 1844 mov -(r1), r4 6e: 1843 mov -(r1), r3 70: 1842 mov -(r1), r2 72: 1146 mov r5, sp 74: 1585 mov (sp)+, r5 76: 0087 rts pc 78: 1037 0018 mov r0, $0x94 7c: 15c0 ffff mov $-1, r0 80: 1146 mov r5, sp 82: 1585 mov (sp)+, r5 84: 0087 rts pc
自作の逆アセンブラによる出力は以下になります。Pythonで作成しています。
$ python ./script/dump.py a.out text size: 134 data size: 14 0: f009 setd 170011 2: 1180 mov sp, r0 010600 4: 1226 mov (r0), -(sp) 011046 6: 0bd0 tst (r0)+ 005720 8: 1036 0002 mov r0, 0o2(sp) 010066 000002 c: 09f7 0008 jsr pc, 0o10(pc) => $0x18 004767 000010 10: 100e mov r0, (sp) 010016 12: 09df 0052 jsr pc, @(pc)+ => 82(0o122 0x52) 004737 000122 16: 8901 sys 1 104401 18: 0977 0040 jsr r5, 0o100(pc) => $0x5c 004567 000100 1c: 15ce 0006 mov $6, (sp) 012716 000006 20: 15e6 0086 mov $206, -(sp) 012746 000206 24: 0a26 clr -(sp) 005046 26: 09df 0030 jsr pc, @(pc)+ => 48(0o60 0x30) 004737 000060 2a: 2596 cmp (sp)+, (sp)+ 022626 2c: 0077 003a jmp 0o72(pc) => $0x6a 000167 000072 30: 1166 mov r5, -(sp) 010546 32: 1185 mov sp, r5 010605 34: 1d40 0004 mov 0o4(r5), r0 016500 000004 38: 1d77 0006 0052 mov 0o6(r5), 0o122(pc) => $0x90 016567 000006 000122 3e: 1d77 0008 004e mov 0o10(r5), 0o116(pc) => $0x92 016567 000010 000116 44: 8900 sys 0 104400 46: 008e .word 0o216 000216 48: 8602 bcc 0x4e 103002 4a: 0077 002a jmp 0o52(pc) => $0x78 000167 000052 4e: 1585 mov (sp)+, r5 012605 50: 0087 rts pc 000207 52: 1166 mov r5, -(sp) 010546 54: 1185 mov sp, r5 010605 56: 1d40 0004 mov 0o4(r5), r0 016500 000004 5a: 8901 sys 1 104401 5c: 1140 mov r5, r0 010500 5e: 1185 mov sp, r5 010605 60: 1126 mov r4, -(sp) 010446 62: 10e6 mov r3, -(sp) 010346 64: 10a6 mov r2, -(sp) 010246 66: 0be6 tst -(sp) 005746 68: 0048 jmp (r0) 000110 6a: 1141 mov r5, r1 010501 6c: 1844 mov -(r1), r4 014104 6e: 1843 mov -(r1), r3 014103 70: 1842 mov -(r1), r2 014102 72: 1146 mov r5, sp 010506 74: 1585 mov (sp)+, r5 012605 76: 0087 rts pc 000207 78: 1037 0018 mov r0, 0o30(pc) => $0x94 010067 000030 7c: 15c0 ffff mov $177777, r0 012700 177777 80: 1146 mov r5, sp 010506 82: 1585 mov (sp)+, r5 012605 84: 0087 rts pc 000207
pdp11-aout-objdump
の出力結果は、8, 10, 16進数が混ざっていて混乱するので、自作の逆アセンブラでは、8, 10, 16進数にはプレフィックス(0x, 0o)を付けました。- オペコードはPDP-11の資料を見ながら一つ一つ解析しています。
- PDP-11の資料は、UNIXv6 ハードウェア資料 - 驟雨のカーネル探検隊(只今遭難中w で紹介されているものを参考にしています。
mov の引数のパターン
Mode | Name | Symbolic | Description |
---|---|---|---|
0 | register | R | Rの値 |
1 | register deferred | (R) | Rの値をアドレスと見なし、そのアドレスの値 |
2 | auto-increment | (R)+ | Rの値をアドレスと見なし、そのアドレスの値; R+=2 |
3 | auto-incr deferred | @(R)+ | Rの値をアドレスと見なし、そのアドレスの値をさらにアドレスとみなし、そのアドレスの値; R+=2 |
4 | auto-decrement | -(R) | R-=2; Rの値をアドレスと見なし、そのアドレスの値 |
5 | auto-decr deferred | @-(R) | R-=2; Rの値をアドレスと見なし、そのアドレスの値をさらにアドレスと見なし、そのアドレスの値 |
6 | index | X(R) | R+Xの値をアドレスと見なし、そのアドレスの値 |
7 | index deferred | @X(R) | R+Xの値をアドレスと見なし、そのアドレスの値をさらにアドレスと見なし、そのアドレスの値 |
表のSymbolicの括弧の意味は、C言語のポインタのデリファレンスと同じと捉えて良いようです。また、@ も同様でポインタのデリファレンスと同じ意味になります。ですから、@ ( R )+
は、( ( R ) )+
のように括弧が2重になったものと解釈すると良いと教えていただきました。C言語のポインタのポインタですね。
(今後の課題)条件式と符号なし整数
『Lions’ Commentary on UNIX (Ascii books)』の278ページには以下の記述があります。
Cでは条件式を使うことができる。aとbが整数変数ならば、
(a > b ? a : b)はaとbの大きなほうを値として持つ式である。ただし、これはaとbが符号なし整数とみなされる場合には機能しない。したがって、次の手続きを使用する。
6326 max (a, b) char *a, *b; { if (a > b) return (a); return (b); }ここでのトリックは、文字へのポインタとして宣言されたaとbが比較のために符号なし整数として扱われるということである。
aとbが符号なしの場合、条件式がなぜ機能しないのか疑問に思いました。その理由を勉強会で教えていただいたのですが、よく理解出来ませんでした……。まだまだ学ぶべきことが沢山あるので、今後の課題となります。理解できたら改めてブログに書くつもりです。
池袋バイナリ勉強会(5)に参加しました
10月21日(日)に開催された池袋バイナリ勉強会(5)に参加しました。PDP-11の実行ファイル(a.out形式)の解析に取り組んでいます。
以下、取り組んだ内容のメモです(書かれている内容には間違いがあるかも知れません)。
前回までの復習
前回までの勉強会で学んだことの復習をしました。
write.sファイルからa.outを作成します。
mov $1, r0 sys write hello 6 mov $0, r0 sys exit .data hello: <hello\n>
v6as
でa.outが作られます(アセンブル、リンク)。v6run
でa.outを実行します。実行するとhelloと出力されます。
$ v6as write.s $ v6run a.out hello
v6strip
でシンボル情報を削除します。
$ v6strip a.out
pdp11-aout-objdump -d a.out
で逆アセンブルします(v6strip
でa.outに含まれるシンボル情報を削除しないと正しく逆アセンブルできません)。
~/etc/pdp-11 $ pdp11-aout-objdump -d a.out a.out: ファイル形式 a.out-pdp11 セクション .text の逆アセンブル: 00000000 <.text>: 0: 15c0 0001 mov $1, r0 4: 8904 sys 4 6: 0010 .word 20 8: 0006 rtt a: 15c0 0000 mov $0, r0 e: 8901 sys 1
- 定義されていない命令は、
.word
として表示されるようです。 .word 20
の20は8進表記です。
逆アセンブル/実行を行うスクリプトの作成
先ほどのwrite.sから出力されたa.outに対して、pdp11-aout-objdump
を実行すると逆アセンブル結果が出力されますが、pdp11-aout-objdump
を使わずに、逆アセンブルを行うスクリプトの作成に取り組みました(write.sで使用している命令のみ)。
a.outをバイナリエディタで開いて、pdp11-aout-objdump
での逆アセンブル結果と見比べます。
$ xxd a.out 0000000: 0701 1000 0600 0000 0000 0000 0000 0100 ................ 0000010: c015 0100 0489 1000 0600 c015 0000 0189 ................ 0000020: 6865 6c6c 6f0a hello.
a.outの先頭16バイトはヘッダになっています。ここにテキストサイズ、データサイズ、シンボル情報のサイズなどが書き込まれているようです。17バイト目から命令が始まっています。
逆アセンブルすることが出来たら、次はa.outを実行するスクリプト("hello"と出力するスクリプト)を作成しました。実際には、mov,sysの正しい振る舞いは理解していないので、それっぽく動作するスクリプトを書いただけです。
v6nm
でシンボルテーブル出力
v6nm
でシンボルテーブルが出力されます。
$ v6as write.s $ v6nm a.out 000020d hello
v6strip
でシンボルテーブルを削除してから、v6nm
を再度実行すると、今度は「no name list」を表示されます。
$ v6strip a.out $ v6nm a.out no name list
strip前後のa.outを見比べてみます。
$ v6as write.s $ xxd a.out 0000000: 0701 1000 0600 0000 0c00 0000 0000 0000 ................ 0000010: c015 0100 0489 1000 0600 c015 0000 0189 ................ 0000020: 6865 6c6c 6f0a 0000 0000 0000 0400 0000 hello........... 0000030: 0000 0000 0000 0000 0000 0000 6865 6c6c ............hell 0000040: 6f00 0000 0300 1000 o....... $ v6strip a.out $ xxd a.out 0000000: 0701 1000 0600 0000 0000 0000 0000 0100 ................ 0000010: c015 0100 0489 1000 0600 c015 0000 0189 ................ 0000020: 6865 6c6c 6f0a hello.
strip前のa.outの9, 10バイト目には0c00とありますが、リトルエンディアンなのでひっくり返して000c(10進数で12)がシンボルテーブルのサイズとなります。strip後ではこの部分の値が0になっているのが確認出来ます。v6strip
実行すると、a.outのファイルサイズが72バイトから38バイトになり、34バイト削られていますから、v6strip
はシンボルテーブル以外にも削っている情報があるということでしょうか(よく分かっていません)。
ちなみに、オフセット0000020には、helloっぽいものがありますが、先ほどv6nm
にて表示されたものがこれに対応しているような感じです。
v6ar
でlibc.aを展開
v6ar
でlibc.aを展開すると、.oファイルが出てきます。
$ ls libc.a $ v6ar x libc.a $ ls abort.o dup.o getpid.o mcount.o ptrace.o stat.o abs.o errlst.o getpw.o mdate.o putc.o stime.o alloc.o execl.o getuid.o mknod.o putchr.o stty.o atof.o execv.o gtty.o mon.o qsort.o sync.o atoi.o exit.o hmul.o mount.o read.o time.o cerror.o ffltpr.o kill.o nargs.o reset.o times.o chdir.o fltpr.o ladd.o nice.o rin.o umount.o chmod.o fork.o ldfps.o nlist.o sbrk.o unlink.o chown.o fstat.o libc.a open.o seek.o wait.o close.o getc.o link.o perror.o setgid.o write.o creat.o getchr.o locv.o pipe.o setuid.o csv.o getcsw.o ltod.o printf.o signal.o ctime.o getgid.o makdir.o prof.o sleep.o
v6cc -S
で*.s出力
v6cc -S
でCプログラムからアセンブリコードを出力できます。
$ cat wr.c main() { write(1, "hello\n", 6); } $ v6cc -S wr.c $ cat wr.s .globl _main .text _main: ~~main: jsr r5,csv mov $6,(sp) mov $L2,-(sp) mov $1,-(sp) jsr pc,*$_write cmp (sp)+,(sp)+ L1:jmp cret .globl .data L2:.byte 150,145,154,154,157,12,0
write()の第1引数の整数
- 0を渡すと、stdin
- 1を渡すと、stdout
- 2を渡すと、stderr
$ cat wr.c main() { write(1, "hello\n", 6); } $ v6cc wr.c $ v6run a.out hello
a.outにはcrt0.sがそのまま含まれている
main() {}
test.cをコンパイルして逆アセンブルした結果を見ると、v6src/s4/crt0.sのコードがそのまま含まれているのが確認できます。
/ C runtime startoff .globl savr5 .globl _exit .globl _main start: setd mov sp,r0 mov (r0),-(sp) tst (r0)+ mov r0,2(sp) jsr pc,_main mov r0,(sp) jsr pc,*$_exit sys exit .bss savr5: .=.+2
以下がa.outの逆アセンブル結果です。
$ pdp11-aout-objdump -d a.out a.out: ファイル形式 a.out-pdp11 セクション .text の逆アセンブル: 00000000 <.text>: 0: f009 setd ↓↓↓↓↓↓ crt0.s ↓↓↓↓↓↓ 2: 1180 mov sp, r0 4: 1226 mov (r0), -(sp) 6: 0bd0 tst (r0)+ 8: 1036 0002 mov r0, 2(sp) c: 09f7 0008 jsr pc, 0x18 10: 100e mov r0, (sp) 12: 09df 0020 jsr pc, *$40 16: 8901 sys 1 ↑↑↑↑↑↑ crt0.s ↑↑↑↑↑↑ 18: 0977 000e jsr r5, 0x2a 1c: 0077 0018 jmp 0x38 20: 1166 mov r5, -(sp) 22: 1185 mov sp, r5 24: 1d40 0004 mov 4(r5), r0 28: 8901 sys 1 2a: 1140 mov r5, r0 2c: 1185 mov sp, r5 2e: 1126 mov r4, -(sp) 30: 10e6 mov r3, -(sp) 32: 10a6 mov r2, -(sp) 34: 0be6 tst -(sp) 36: 0048 jmp (r0) 38: 1141 mov r5, r1 3a: 1844 mov -(r1), r4 3c: 1843 mov -(r1), r3 3e: 1842 mov -(r1), r2 40: 1146 mov r5, sp 42: 1585 mov (sp)+, r5 44: 0087 rts pc
その他、学んだこと
mov命令でのPC(プログラムカウンタ)について学びました(ここに書けるほどには理解していませんが……)。
以下の2冊の本を紹介していただきました。
- 作者: John R. Levine,榊原一矢,ポジティブエッジ
- 出版社/メーカー: オーム社
- 発売日: 2001/09
- メディア: 単行本
- 購入: 7人 クリック: 171回
- この商品を含むブログ (54件) を見る
Lions’ Commentary on UNIX (Ascii books)
- 作者: ジョンライオンズ,John Lions,岩本信一
- 出版社/メーカー: アスキー
- 発売日: 1998/07
- メディア: 単行本
- 購入: 12人 クリック: 627回
- この商品を含むブログ (27件) を見る
『Lions’ Commentary on UNIX (Ascii books)』は、さっそく購入しました。
池袋バイナリ勉強会(2)に参加してきました
9月23日(日)に池袋バイナリ勉強会(2)に参加してきました。
MonoDevelopでHello world!
MonoDevelopとGTK#を用いて、ボタンをクリックしたらメッセージダイアログを表示するGUIプログラムを書きました。
- MonoDevelopをインストールします。MonoDevelopからダウンロード出来ます。
- Gtk# 2.0プロジェクト新規作成。
- ウィンドウにボタンを配置して、イベントハンドラに"World!"とメッセージダイアログを表示するコードを記述します。
protected void OnButton3Clicked (object sender, EventArgs e) { var md = new MessageDialog(this, DialogFlags.Modal, MessageType.Info, ButtonsType.Ok, "World!"); md.Run (); md.Destroy (); }
ボタンを押すと、以下のようにメッセージダイアログが表示されます。
躓いたところ:
- なぜかぼくのMacBook(OS X 10.8.2)では、MonoDevelop(バージョン 3.0.4.7)上で縦棒「|」を入力すると、MonoDevelop上では閉じ括弧「}」が入力されてしまう問題が発生しました。別のMacを使っている方は問題ないようでした。原因わからず……。
GUI Brainf*ckインタプリタの作成
次にMonoDevelopでGUI Brainfckのインタプリタを作りました。Brainfckのコマンド(> < + - . , [ ])をそれぞれボタンに割り当てて、ボタンを押すとそのコマンドが実行されるGUIプログラムです。
- 資料にしたがってGTK#でGUIを組み立てていきます。手順ごとの説明が分かりやすく、最後までつまることなく出来ました。ウィジェットを配置するたびに、その都度テストして動作確認する仕組みになっているので、もし間違っていればその段階で気づくことが出来るようになっています。
GUIが完成したら、次の命令を実行して動作確認しました。
+++++++++[>++++++++<-]>.
ボタンをポチポチ押して、上のプログラムを実行すると H が出力されたらOKです。
PythonでBrainf*ck
次にPythonでBrainf*ckインタプリタを作りました。
プログラム完成後、Hello world!と出力するbrainf*ckプログラムを実行して動作確認。それから勉強会に参加している方からサンプルコードをいただいてその動作確認もしました(ファイルを下さった方のお名前が分かりません。すみません)。
作成したスクリプトは以下です。
PDP-11にチャレンジ
次にPDP-11のバイナリ解析に取り組みました。
などを行いました。
はじめに id:n7shi さんのブログのコマンドライン版インタプリタから開発環境をインストールします。
Cソースを作成します。
main() { printf("hello\n"); }
v6cc
でコンパイルすると、a.outが生成されます。fileコマンドでa.outを調べると、PDP-11のバイナリであることが確認できます。
$ v6cc hello.c $ file a.out a.out: PDP-11 executable not stripped
実行するには、v6runコマンドを使います。
$ v6run a.out hello
pdp11-aout-objdump
コマンドで逆アセンブルします。
$ pdp11-aout-objdump -d a.out a.out: ファイル形式 a.out-pdp11 pdp11-aout-objdump: a.out: ファイルが途切れています
実行すると、上のように「ファイルが途切れています」と表示されます。これは、a.outに含まれるデバッグ情報、シンボル情報の形式が、pdp11-aout-objdump
で扱えないためです。そのため、v6strip
でこれらの情報を削除します。
$ v6strip a.out
再びpdp11-aout-objdump
を実行すると、今度は逆アセンブル結果が表示されます。
$ pdp11-aout-objdump -d a.out a.out: ファイル形式 a.out-pdp11 セクション .text の逆アセンブル: 00000000 <.text>: 0: f009 setd 2: 1180 mov sp, r0 4: 1226 mov (r0), -(sp) 6: 0bd0 tst (r0)+ 8: 1036 0002 mov r0, 2(sp) c: 09f7 0008 jsr pc, 0x18 10: 100e mov r0, (sp) 12: 09df 024a jsr pc, *$1112 16: 8901 sys 1 18: 0977 0238 jsr r5, 0x254 1c: 15ce 0270 mov $1160, (sp) 20: 09df 0028 jsr pc, *$50 24: 0077 023a jmp 0x262 28: 0977 0228 jsr r5, 0x254 2c: e5c6 007e sub $176, sp 30: 1d77 0004 027c mov 4(r5), $0x2b2 36: 1144 mov r5, r4 38: 65c4 0006 add $6, r4 3c: 9fc0 0272 movb *$0x2b2, r0 40: 0309 beq 0x54 42: 0ab7 026c inc $0x2b2 46: 2017 0025 cmp r0, $45 4a: 0306 beq 0x58 4c: 100e mov r0, (sp) 4e: 09df 01da jsr pc, *$732 52: 01f4 br 0x3c 54: 0077 020a jmp 0x262 58: 0a37 0258 clr $0x2b4 5c: 0a37 0258 clr $0x2b8 60: afd7 024e 002d cmpb *$0x2b2, $55 66: 0204 bne 0x70 68: 0ab7 0246 inc $0x2b2 6c: 0ab7 0244 inc $0x2b4 70: 08f7 0128 jsr r3, 0x19c 74: 1077 0238 mov r1, $0x2b0 78: 0a37 023a clr $0x2b6 7c: 2017 002e cmp r0, $56 80: 0204 bne 0x8a 82: 08f7 0116 jsr r3, 0x19c 86: 1077 022e mov r1, $0x2b8 8a: 1183 mov sp, r3 8c: 65c3 0004 add $4, r3 90: 15c1 0278 mov $1170, r1 94: 1442 mov (r1)+, r2 96: 03da beq 0x4c 98: 2011 cmp r0, (r1)+ 9a: 02fc bne 0x94 9c: 004a jmp (r2) 9e: 1501 mov (r4)+, r1 a0: 0405 bge 0xac a2: 0b01 neg r1 a4: 95d3 002d movb $55, (r3)+ a8: 0101 br 0xac aa: 1501 mov (r4)+, r1 ac: 09f7 0002 jsr pc, 0xb2 b0: 0152 br 0x156 b2: 0a00 clr r0 b4: 7217 000a div $12, r0 b8: 1066 mov r1, -(sp) ba: 1001 mov r0, r1 bc: 0302 beq 0xc2 be: 09f7 fff0 jsr pc, 0xb2 c2: 1580 mov (sp)+, r0 c4: 65c0 0030 add $60, r0 c8: 9013 movb r0, (r3)+ ca: 0087 rts pc cc: 9513 movb (r4)+, (r3)+ ce: 0201 bne 0xd2 d0: 0ac3 dec r3 d2: 9513 movb (r4)+, (r3)+ d4: 0240 bne 0x156 d6: 0ac3 dec r3 d8: 013e br 0x156 da: 1dc1 01da mov $0x2b8, r1 de: 0a03 clr r3 e0: 1302 mov (r4), r2 e2: 8bd2 tstb (r2)+ e4: 0302 beq 0xea e6: 0a83 inc r3 e8: 7e44 sob r1, 0xe2 ea: 1502 mov (r4)+, r2 ec: 0138 br 0x15e ee: 15c2 02a0 mov $1240, r2 f2: 0102 br 0xf8 f4: 15c2 02a4 mov $1244, r2 f8: 1501 mov (r4)+, r1 fa: 0305 beq 0x106 fc: 0bf7 01b8 tst $0x2b8 100: 0302 beq 0x106 102: 95d3 0030 movb $60, (r3)+ 106: 0a00 clr r0 108: 09f7 0002 jsr pc, 0x10e 10c: 0124 br 0x156 10e: 1066 mov r1, -(sp) 110: 760a ashc (r2), r0 112: 0302 beq 0x118 114: 09f7 fff6 jsr pc, 0x10e 118: 1580 mov (sp)+, r0 11a: 4c80 0002 bic 2(r2), r0 11e: 65c0 0030 add $60, r0 122: 2017 0039 cmp r0, $71 126: 0702 ble 0x12c 128: 65c0 0007 add $7, r0 12c: 9013 movb r0, (r3)+ 12e: 0087 rts pc 130: 1dc0 0184 mov $0x2b8, r0 134: 1dc2 017e mov $0x2b6, r2 138: 09f7 0094 jsr pc, 0x1d0 13c: 010c br 0x156 13e: 1dc0 0176 mov $0x2b8, r0 142: 1dc2 0170 mov $0x2b6, r2 146: 09f7 0086 jsr pc, 0x1d0 14a: 0105 br 0x156 14c: 1504 mov (r4)+, r4 14e: 1537 0160 mov (r4)+, $0x2b2 152: 0077 fee6 jmp 0x3c 156: 1182 mov sp, r2 158: 65c2 0004 add $4, r2 15c: e083 sub r2, r3 15e: 1126 mov r4, -(sp) 160: 15e6 0020 mov $40, -(sp) 164: 10c4 mov r3, r4 166: 0b03 neg r3 168: 6dc3 0144 add $0x2b0, r3 16c: 0706 ble 0x17a 16e: 0bf7 0142 tst $0x2b4 172: 0203 bne 0x17a 174: 09df 01da jsr pc, *$732 178: 7ec3 sob r3, 0x174 17a: 0bc4 tst r4 17c: 0304 beq 0x186 17e: 948e movb (r2)+, (sp) 180: 09df 01da jsr pc, *$732 184: 7f04 sob r4, 0x17e 186: 0bc3 tst r3 188: 0705 ble 0x194 18a: 15ce 0020 mov $40, (sp) 18e: 09df 01da jsr pc, *$732 192: 7ec3 sob r3, 0x18e 194: 0bd6 tst (sp)+ 196: 1584 mov (sp)+, r4 198: 0077 fea0 jmp 0x3c 19c: 0a37 0116 clr $0x2b6 1a0: 0a01 clr r1 1a2: 9fc0 010c movb *$0x2b2, r0 1a6: 0ab7 0108 inc $0x2b2 1aa: e5c0 0030 sub $60, r0 1ae: 2017 fffa cmp r0, $-6 1b2: 0202 bne 0x1b8 1b4: 1500 mov (r4)+, r0 1b6: 0103 br 0x1be 1b8: 2017 0009 cmp r0, $11 1bc: 8206 bhi 0x1ca 1be: 0ab7 00f4 inc $0x2b6 1c2: 7057 000a mul $12, r1 1c6: 6001 add r0, r1 1c8: 01ec br 0x1a2 1ca: 65c0 0030 add $60, r0 1ce: 0083 rts r3 1d0: 65c4 0008 add $10, r4 1d4: 95d3 003f movb $77, (r3)+ 1d8: 0087 rts pc 1da: 1166 mov r5, -(sp) 1dc: 1185 mov sp, r5 1de: 1dc0 00dc mov $0x2be, r0 1e2: 0204 bne 0x1ec 1e4: 09f7 002c jsr pc, 0x214 1e8: 1dc0 00d2 mov $0x2be, r0 1ec: 9d50 0004 movb 4(r5), (r0)+ 1f0: 0307 beq 0x200 1f2: 0ab7 00c8 inc $0x2be 1f6: 0af7 00c2 dec $0x2bc 1fa: 0602 bgt 0x200 1fc: 09f7 0014 jsr pc, 0x214 200: 1d40 0004 mov 4(r5), r0 204: 1585 mov (sp)+, r5 206: 0087 rts pc 208: 1166 mov r5, -(sp) 20a: 1185 mov sp, r5 20c: 09f7 0004 jsr pc, 0x214 210: 1585 mov (sp)+, r5 212: 0087 rts pc 214: 1dc0 00a6 mov $0x2be, r0 218: 030a beq 0x22e 21a: e5c0 02c0 sub $1300, r0 21e: 1037 008a mov r0, $0x2ac 222: 1dc0 0094 mov $0x2ba, r0 226: 0201 bne 0x22a 228: 0a80 inc r0 22a: 8900 sys 0 22c: 02a8 bne 0x17e 22e: 15f7 02c0 008a mov $1300, $0x2be 234: 15f7 0200 0082 mov $1000, $0x2bc 23a: 2dd7 007c 0002 cmp $0x2ba, $2 240: 8203 bhi 0x248 242: 15f7 0001 0074 mov $1, $0x2bc 248: 0087 rts pc 24a: 1166 mov r5, -(sp) 24c: 1185 mov sp, r5 24e: 1d40 0004 mov 4(r5), r0 252: 8901 sys 1 254: 1140 mov r5, r0 256: 1185 mov sp, r5 258: 1126 mov r4, -(sp) 25a: 10e6 mov r3, -(sp) 25c: 10a6 mov r2, -(sp) 25e: 0be6 tst -(sp) 260: 0048 jmp (r0) 262: 1141 mov r5, r1 264: 1844 mov -(r1), r4 266: 1843 mov -(r1), r3 268: 1842 mov -(r1), r2 26a: 1146 mov r5, sp 26c: 1585 mov (sp)+, r5 26e: 0087 rts pc
helloだけでこれだけの長さ……。printfを使うと引数解析などの処理が必要でコードが長くなるそうです。いきなりこれを理解するのは難しいので、最初は以下のアセンブリコードから取り組みました。
mov $1, r0 sys write hello 6 mov $0, r0 sys exit hello: <hello\n\0>
v6as
でアセンブルすると、a.outが生成されます。
$ v6as hello.s $ v6run a.out hello
逆アセンブルします。
$ v6strip a.out $ pdp11-aout-objdump -d a.out a.out: ファイル形式 a.out-pdp11 セクション .text の逆アセンブル: 00000000 <.text>: 0: 15c0 0000 mov $1, r0 4: 8904 sys 4 6: 0010 .word 20 8: 0006 rtt a: 15c0 0000 mov $0, r0 e: 8901 sys 1 10: 6568 add (r5)+, *-(r0) 12: 6c6c 0a6f add 5157(r1), *-(r4) …
hello.sには含まれない命令(addなど)が表示されていますが、これは文字列データ(hello)が命令と見なされるため、上のように表示されるのだそうです。
オペコード、レジスタなど他にもいろいろ教えていただきました。自分の中であまり整理と理解が出来ていないので、箇条書きでメモしておきます。
バイナリ形式
a.outが出来るまで
.cファイル(C言語) --> .sファイル(アセンブリ言語) --> .o(オブジェクトファイル) --> a.out コンパイル アセンブル(as) リンク(ld)
.sから逆アセンブリまでのコマンドを一気に実行
v6as hello.s && v6strip a.out && pdp11-aout-objdump -d a.out
v6src/s5/write.sのソース
/ C library -- write / nwritten = write(file, buffer, count); / / nwritten == -1 means error .globl _write, cerror _write: mov r5,-(sp) mov sp,r5 mov 4(r5),r0 mov 6(r5),0f mov 8(r5),0f+2 sys 0; 9f bec 1f jmp cerror 1: mov (sp)+,r5 rts pc .data 9: sys write; 0:..; ..
更新履歴:
- (2012-10-28): hello.sのコードを修正しました。
- (2012-12-02): gistを貼り付けました(bf.py)
Codeforces 110B - B. Lucky String
calc :: Int -> String calc n = take n $ cycle "abcd" main = do s <- getLine putStrLn $ calc $ read s
Processing, プロジェクト名と同じ名前のクラスは定義できない。
プロジェクト名(.pdeファイル名)と同じ名前のクラスを定義しようとすると、以下のエラーメッセージが表示されました。
The nested type Test cannot hide an enclosing type
Processingで正三角形を描画する
Processingで正三角形を描画しようと思い、コードを書き始めたけど、すぐに手が止まってしまった。triangle()を使って、3点の座標位置を指定すれば三角形を描画できる。だけど、3点の座標位置はどう決めたら良いのだろうか?
そもそも正三角形とはどういう形をしているのか。Wikipediaには次のように書いてある。
正三角形(せいさんかくけい、英: equilateral triangle)は、正多角形である三角形である。つまり、3本の辺の長さが全て等しい三角形である。3つの内角の大きさが全て等しい三角形と定義してもよい。1つの内角は 60°(π/3 rad)である。また一つの内角が60°である二等辺三角形は正三角形となる。
正三角形 - Wikipedia
3本の辺の長さが等しい、3つの内角の大きさが全て等しい、1つの内角は60°ということは理解していた。では、そこから正三角形の3点の座標位置はどうなると言えるのか。上のページを読み進めると、正三角形の高さは、辺の長さをaとすると、a*sqrt(3)/2 となると書かれてある。つまり、高さは整数にはならない。
さらにページを読み進めると、正三角形の3点の座標位置の求め方も書いてある。これを使えば3点の位置も求めることが出来るけれど、なぜそのような値になるのか考えてみた。正三角形に何本かの補助線を引いてみると、意外に簡単に計算できた。
上図の正三角形の内部にみえる小さな三角形は全て、それぞれ内角が30°、60°、90°の直角三角形になっている。b, c, dの値はそれぞれ次のようになる。
b = a/2 * sin60° c = a/2 * cos60° d = c * tan30°
点Aの座標は、(x, y-(b+d))となる(y座標は下向きを正としている)。点Bと点Cの座標は、点の回転公式より求めた。
(x, y)を原点のまわりに角aだけ回転して(x', y')に移されるとき、 x' = x*cos(a) - y*sin(a) y' = x*sin(a) + y*cos(a)
Processingプログラム:
// -*- mode: java -*- class EqTriangle { // equilateral triangle float x, y, n; public EqTriangle(int x, int y, int n) { this.x = x; this.y = y; this.n = n; } public void draw(int angle) { float b = this.n * sqrt(3) / 4.0; float c = this.n / 4.0; float d = c * tan(radians(30)); float x1 = 0; float y1 = -(b + d); float r = radians(120); float x2 = x1*cos(r) - y1*sin(r); float y2 = x1*sin(r) + y1*cos(r); float x3 = x1*cos(r*2) - y1*sin(r*2); float y3 = x1*sin(r*2) + y1*cos(r*2); pushMatrix(); translate(this.x, this.y); rotate(radians(angle)); triangle(x1, y1, x2, y2, x3, y3); popMatrix(); } } EqTriangle t1, t2, t3; void setup() { size(400, 400); t1 = new EqTriangle(width/2, height/2, 60); t2 = new EqTriangle(width/2, height/2, 100); t3 = new EqTriangle(width/2, height/2, 140); } void draw() { background(255); noFill(); t1.draw(frameCount); t2.draw(-frameCount); t3.draw(frameCount); }
実行すると、以下のように正三角形がくるくると回転します。
primesパッケージをインストール
primesパッケージをインストールします。
cabal install primes
Prelude Data.Numbers.Primes> take 30 primes [2,3,5,7,11,13,17,19,23,29,31,37,41,43,47,53,59,61,67,71,73,79,83,89,97,101,103,107,109,113] Prelude Data.Numbers.Primes> primes !! 0 2 Prelude Data.Numbers.Primes> primes !! 9999 104729 Prelude Data.Numbers.Primes> primeFactors 1234567 [127,9721] Prelude Data.Numbers.Primes> primeFactors 12345 [3,5,823] Prelude Data.Numbers.Primes> filter isPrime [1..100] [2,3,5,7,11,13,17,19,23,29,31,37,41,43,47,53,59,61,67,71,73,79,83,89,97]
Project Eulerの問題を解くときに使ってみよう。
参考: