■掲示板に戻る■ ■過去ログ倉庫めにゅーに戻る■
文字列生成プログラム
1 名前: Stringer 投稿日: 2000/11/04(土) 16:42
文字列生成プログラムが欲しいです。
学校の課題というわけではなく、
自分の必要に駆られてです。

標準入力から文字列表現を読みこみ→標準出力へすべての文字列を出力

みたいなので、なにか参考になるようなソースか資料ってありますか?


2 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/04(土) 16:46
へ?


3 名前: Stringer 投稿日: 2000/11/04(土) 16:48
ちなみに、今、自分で作る場合の文字列表現を考えてみました

'aaa' 文字列
+ 連結演算子 ex 'aaa'+'bbb' → 'aaabbb'
| 選択演算子 ex 'aaa'|'bbb' → 'aaa' と 'bbb'
- 範囲指定演算子 ex 'aa'-'bb' → 'aa' と 'ab' と 'ba' と 'bb'
() 優先順位指定
[] 優先順位指定&省略可能指定

よく分からないかも(^^;

バッカスナウア表現とかいうのを作って、yaccだかなんだかで作るっていうのが
正道なんでしょうか?



4 名前: Stringer 投稿日: 2000/11/04(土) 16:53
>2さん
ごめんなさい。意味不明ですよね。。。
「文字列生成規則を表す文字列を入力として、その規則から生成されるすべての
文字列を出力する。」っていうプログラムなんですけど、どこかにそれらしい
資料等ありませんか?


5 名前: >4 投稿日: 2000/11/04(土) 16:59
形式システムによる定理生成プログラムのことか?


6 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/04(土) 17:01
もうすこし考えてからスレたてろや


7 名前: Stringer 投稿日: 2000/11/04(土) 17:09
>5さん
すいません。あんまりむずかしいことは分からないんですけど、
ぶっちゃけた話をすると、「インターネット画像ダウンロードプログラム」
を作りたいんです。

たとえば
http://www.hogehoge/picture/pic01.jpeg
http://www.hogehoge/picture/pic02.jpeg
         ・
         ・
http://www.hogehoge/picture/pic99.jpeg

という画像ファイルがあった場合に、MS-DOSコマンドラインから、

a:>picget 'http://www.hogehoge/picture/pic'+('0'-'9')+('0'-'9')+'.jpeg'

とプログラムを起動すると、その画像ファイルをHDD上に保存できるというような。

それで、まずは文字列(URL)を生成しなきゃいけないので、そこのところを考え中です。
車輪の再発明はしたくないので、何か利用できるものがあったら利用しようと思ったのですが。


8 名前: Stringer 投稿日: 2000/11/04(土) 17:11
>6さん
すいません。出直してきます。


9 名前: 5>7 投稿日: 2000/11/04(土) 17:19
perlと正規表現を覚えたら?
まさにその機能を最初から備えてるよ


10 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/04(土) 17:27
3の様なメタ表現を文字列に含ませたいならば、
正規表現(regular expression = re)が一般的です。
上の機能も、すべて正規表現だけで実現できそうですね。
正規表現の種類は1つではなく、いくつかのバージョンがあります。
perlは拡張正規表現+α(独自拡張)の実装が載っています。
多分、これのソース読むのが近道だと思います。
あとはunixのegrep/vi(ed)/emacsなど。
さらに、vectorとかに行くと、正規表現ライブラリというのもいくつかあります。
なぜperlの正規表現を薦めるかと言うと、
1)流行、一般的(一番使われている)、
2)現在進行形で一番メンテナンスされていて、枯れている(バグが少ない)、
からです。


11 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/04(土) 17:29
あと、正規表現はただでさえ慣れないとわかりにくいので、
ネットに公開する様なアプリに組み込む場合、
独自拡張は避けた方が無難です。(どうせ使ってくれないので…
perl5互換、とかなら使ってくれるかも。
そういや、Windows出身のアプリでは正規表現は全く使われてないですね。
コーダがみんなアホなのでしょうか?…


12 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/04(土) 17:30
C/C++なら、regex.hでも探してこい


13 名前: Stringer 投稿日: 2000/11/04(土) 17:30
>5さん
アドバイスありがとうございます。
自分も最初は「正規表現で逝ける!!」と思って、フリーのライブラリを
あたってみました。
でも、たいていの正規表現のライブラリって、パターンマッチングは出来ても生成はできないんです。
文字列を順列的に生成してマッチングっていうのでは速度的に問題があると思いまして。。。
ちなみに、perlだと生成もできるんですか?


14 名前: Stringer 投稿日: 2000/11/04(土) 17:35
>10さん、11さん、12さん
ありがとうございます。最初の説明が言葉足らずでした。
問題は13の通りなんですが、正規表現で生成もできるようなものを探してみたいと思います。


15 名前: 10=11 投稿日: 2000/11/04(土) 17:52
>>14
生成って何のこと?
マッチングした出力結果?
…お話からすると、つまりiriaのurlの展開機能を真似たいクサイですね。
ありゃ、正規表現じゃないですよ…ただの書式出力。
そんなのカウントアップループ一発じゃないか!
ああ真面目に解説して損した…。


16 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/04(土) 17:52
>>11
> そういや、Windows出身のアプリでは正規表現は全く使われてないですね。
> コーダがみんなアホなのでしょうか?…

他人をアホ呼ばわりする前にせめて秀丸ぐらい使ったらどうだ。



17 名前: 10=11=15 投稿日: 2000/11/04(土) 18:00
>>16
そうだね。「全く」は言い過ぎだったよ。


18 名前: Stringer 投稿日: 2000/11/04(土) 18:21
>10さん
iriaっていうソフトを使ったことがないので真似たいかどうかは分かりませんが、
たぶんそういうようなものだと思います。
iriaを使えば自分で作る必要ないってことですね。
では、ご迷惑かけてすみませんでした。


19 名前: 10=11=15=17 投稿日: 2000/11/04(土) 18:32
>>18
やっぱりそうなのか…


20 名前: 10=11=15=17=19@優しい人 投稿日: 2000/11/04(土) 19:46
まとめ。
1はつまりエロ画像収集厨房だったわけね。
iria知らないって事はワレザーの線は消えるか。
>>1
>自分の必要に駆られてです。
って事は、自慰のお手伝いしちゃったわけだ。
鬱だ…


21 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/05(日) 00:11
実はそれは偽装でやっぱ宿題だったに、1票


22 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/05(日) 08:30
正規表現がマッチする文字列の集合の出力なんてしたら、
あっという間に数が爆発すると思うけど。


23 名前: Stringer 投稿日: 2000/11/06(月) 02:18
>22さん
そうですよね。正規表現はあくまでマッチングとか置換とかそういう用途向けみたいですね。

で、iriaをダウンロードしてみたのですが、使い方がよく分からない(というかヘルプがついてない)
ので、やっぱり自分で作ろうと思います。
僕の足りない脳みそでは「カウントアップループいっぱつ」で7のような機能を作ることは出来ないので、
勉強もかねて、再帰的下向き構文解析を自分で書いてみることにしました。

<式> := <項> 又は <項>|<項>
<項> := <因子> 又は <因子>+<因子>
<因子> := <文字列> 又は <文字列>-<文字列> 又は (<式>) 又は [<式>]
<文字列> := <英数字及び記号>の0個以上並んだものを' ではさんだもの
<英数字及び記号> := 適当

みたいな感じでやってみることにします。
以上、ご報告まで。


24 名前: Stringer 投稿日: 2000/11/06(月) 02:28
あ、23だと
'a'|'b'|'c'
とかがエラーになっちゃいますね。
鬱だ…


25 名前: Stringer 投稿日: 2000/11/06(月) 02:34
訂正版

<式> := <項> 又は <項>|<式>
<項> := <因子> 又は <因子>+<項>
<因子> := <文字列> 又は <文字列>-<文字列> 又は (<式>) 又は [<式>]
<文字列> := <英数字及び記号>の0個以上並んだものを' ではさんだもの
<英数字及び記号> := 適当

では。


26 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/06(月) 02:51
思いっきり遠回りしてるような気がするけど...

変化するのが数字だけなら、とりあえず
picget "http://www.hogehoge/picture/pic%d.jpeg",0-99
ってのを作ってみれば?
文字への拡張も簡単にできる。perlならもっと簡単。

でもまあエロパワーを原動力にして構文解析覚えるのも悪くないね。


27 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/06(月) 03:11
10=11=15=17=19=20
のほうが厨房だと思うがいかがか?


28 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/06(月) 03:22
27=Stringerか?


29 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/06(月) 03:26
エロ画像収集厨房呼ばわりされて逆上するStringer。
そして彼の逆襲はここから始まる、、、


30 名前: >27 投稿日: 2000/11/06(月) 03:30
発想としては元となるhtmlからリンク先抜き出して
正規表現でフィルタかけるって思うんじゃない?

10=11=15=17=19=20は偉そうなこと言ってるわりに
エロ画像収集の経験が浅いんだろうね(藁


31 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/06(月) 03:44
>>30=27=1
そんなことをおおいばりで自慢するな!


32 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/06(月) 04:47
>勉強もかねて、再帰的下向き構文解析を自分で書いてみることにしました。
どうせならyacc(Bison)で簡潔に書け。
エロ画像は待ってはくれないぞ!


33 名前: > 投稿日: 2000/11/06(月) 04:53
まってはくれないが新しいのもいくらでも出てくるからまあいいだろ‥


34 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/06(月) 05:03
外人と日本人(アジア系も含む?)、どっちがいい?
おれはやっぱ日本人。


35 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/06(月) 07:13
>>34
乳は外人。それ以外は日本人!


36 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/06(月) 13:14
cshなら
set digits=(0 1 2 3 4 5 6 7 8 9)
foreach i ($digits)
 foreach j ($digits)
  wget http://www.hoge.com/pic$i$j.jpg
 end
end
といった具合にできるけど、これではだめなの?


37 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/06(月) 13:18
csh(じゃなくてもいいけど)もwgetもWindowsに移植されてるから、これでいいじゃん。


38 名前: Stringer 投稿日: 2000/11/08(水) 13:18
最近、学校とバイトが時間がつぶれて、PCで遊ぶ時間がなかったです。

>26さん
>でもまあエロパワーを原動力にして構文解析覚えるのも悪くないね。
ついでにお遊びのプログラミングなんで、自己満足出来るようなものを書きたいです(^^;
なので、>picget "http://www.hogehoge/picture/pic%d.jpeg",0-99 っていうのは
あんまり自己満足できそうにないので、7みたいなのを目指してみます。

>36さん,37さん
「コマンドラインで一発!!、エロ画像で三発!!」っていうのがうりなんで、、、
エロ画像を得るために、毎回スクリプト書くのめんどくさいじゃないですか。。。

>32さん
自分で書いてみましたが、自分でもまともに動くかどうかよく分からない、
保守性のホの字もない、条件分岐の塊のようなコードが出来あがってしまったので、
これからyaccをやってみようと思います。

参考までに、今まで書いたコードは
http://ntt-east.virtualave.net/genstr.lzh
にあります。
たくさんバグがあると思いますので、
実行した結果に対して自分は責任を負いません。
素人が構文解析を自分の手で書くとこういうふうになるという
サンプルとしてお役立てください。(コメントもほとんどないし)
コーディングに対する批判は大歓迎です。

では。アドバイスしてくださった皆さん、ありがとうございました。



39 名前: ななしさん@目立ちたがりの厨房 投稿日: 2000/11/08(水) 16:56
>>32
>エロ画像は待ってはくれないぞ!
これ面白いですネ!
俺も使おう。(藁



40 名前: 名無しさん@お腹いっぱい。 投稿日: 2000/11/08(水) 23:37
webcopyをちょっといじって-kと-Kに正規表現を入れられるようにすれば簡単


41 名前: Stringer 投稿日: 2000/11/09(木) 01:07
とりあえず動いてるのでyaccは後回し。
文字列生成性交。
今日はトゥナイトで散々がんばったのでおやすみなさい。
参考までに、
ソース(VC++6.0)
http://ntt-east.virtualave.net/gss01109.lzh
実行ファイル(Win32,その他DLL必要なし)
http://ntt-east.virtualave.net/gse01109.lzh
例によって at your own riskで。

あとはこれをどうhttp/ftpクライアントにつなげていくか…。
wgetに組みこむとか。。。。
バッチファイルかなんかで既存のクライアントと連動とか。
誰かやってください(笑)

とりあえずyacc使ってみよう。


42 名前: Stringer 投稿日: 2000/11/09(木) 02:35
まどろみのなかでメモリリークに気づき、こっそり修正。