■ このスレッドは過去ログ倉庫に格納されています
パソコンのプロいますか?
- 1 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:48:03.242 ID:eZpBqQRRa.net
- htmlの文書の3行目をファイル名にしたいんですけどそういうことってできます?
- 2 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:48:35.018 ID:kFNsjGI1d.net
- できます
- 3 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:48:38.731 ID:5W4sVNVBd.net
- できません
- 4 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:48:51.031 ID:eZpBqQRRa.net
- できますか
- 5 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:49:07.589 ID:f3++pZTd0.net
- どういうこと?
- 6 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:49:19.003 ID:1fptmbbf0.net
- 余裕です
- 7 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:49:24.973 ID:gpufVIbk0.net
- できま
- 8 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:49:36.948 ID:J16kQHem0.net
- すん
- 9 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:49:41.849 ID:ofUp+uZU0.net
- お前の日本語がわからん
- 10 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:49:47.403 ID:sMvmjCH10.net
- すん
- 11 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:50:03.553 ID:SwQw9Kg50.net
- もう少しくわしく
- 12 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:50:08.534 ID:f3++pZTd0.net
- 三行目をコピーします
名前に貼り付けて変更します
- 13 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:50:11.240 ID:eZpBqQRRa.net
- ファイル数が5000くらいあるんですけど
その文書の中の単語をファイル名にしたいんです
- 14 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:50:54.715 ID:f3++pZTd0.net
- >>13
ファイル数5000ってhtmlが五千個あるんですか?
- 15 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:51:15.784 ID:eZpBqQRRa.net
- >>14
あります
- 16 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:51:20.750 ID:ofUp+uZU0.net
- phpでも使ってろ
- 17 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:51:24.451 ID:1fptmbbf0.net
- 複数のhtmlファイルのファイル名を一括で「titleタグの内容.html」とかにリネームするってことでしょ?
- 18 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:51:49.061 ID:iOGEdti90.net
- ツール探すか、スプリクト組めば可能
- 19 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:52:15.283 ID:eZpBqQRRa.net
- >>17
そういうことです
>>16
どうつかいますか?
- 20 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:52:15.445 ID:J16kQHem0.net
- 10分ありゃできるな
- 21 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:52:18.493 ID:67cUo6Qu0.net
- 標準Cライブラリだけでも出来そうな話
パソコンのプロっていうかプログラミングの話だけど
- 22 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:52:22.202 ID:oBe2A0KK0.net
- それでファイル名が重複しないの?
- 23 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:52:24.250 ID:uFeOOaOiM.net
- できるでしょ
- 24 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:52:59.902 ID:eZpBqQRRa.net
- 1000個くらい手入力してて吐き気してきたからもしかしてこれなんかうまいことできるのか?ってスレ立てて見たんです
- 25 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:53:13.016 ID:kFNsjGI1d.net
- >>22
どちらかといえばそのほうが面倒だよな
- 26 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:53:48.496 ID:eZpBqQRRa.net
- >>20
>>18
くんだことないです
>>22
したら(2)とかでおねがいします
- 27 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:53:57.537 ID:Wbi+ciuO0.net
- 意味わからんから誰か教えて
- 28 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:54:10.612 ID:eZpBqQRRa.net
- >>21
お願いします
- 29 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:55:11.631 ID:Wbi+ciuO0.net
- ああ、スクレイピングして名前変えたいんか
- 30 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:55:37.746 ID:J16kQHem0.net
- チャンスじゃん
プログラミング的思考を身につける第一歩やん
- 31 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:55:48.726 ID:67cUo6Qu0.net
- >>28
今から寝るところです
- 32 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:56:02.464 ID:eZpBqQRRa.net
- >>29
あーそれだとおもいます
- 33 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:56:24.292 ID:eZpBqQRRa.net
- >>31
まだ眠れません
- 34 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:56:49.182 ID:iOGEdti90.net
- nodeが絡むプログラム触るのに抵抗あるの俺だけかな
- 35 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:57:20.516 ID:Wbi+ciuO0.net
- titleタグを抽出するだけならパースの必要性はないかもな
正規表現とかで出来そう
- 36 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:57:44.516 ID:eZpBqQRRa.net
- くそう
プログラムできたら数分で終わってたのか!!!
- 37 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:58:03.173 ID:eYVWZaH2d.net
- バッチ書け
全部パイプラインでやろうとすると死ぬぞ
- 38 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:58:07.691 ID:oBe2A0KK0.net
- リンクがぶちぶちちぎれて文句言いそう
- 39 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:58:26.057 ID:eZpBqQRRa.net
- >>35
なにをどうしたらいいですか
ヒント的なワードででも
- 40 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 01:59:08.424 ID:1fptmbbf0.net
- 環境構築のこと考えるとVBSでやるのが一番手っ取り早いのかな?
- 41 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:00:55.720 ID:eZpBqQRRa.net
- 詳しく説明しますと
無料ブログが終わるって言うので15年くらい書いてたブログのデータをぶっこ抜いたのは成功したんですけどタイトルがむちゃくちゃなんですね
それでファイル開くとブログ内容がでてきて3行目にタイトルがあるので日付とタイトルをファイル名にしたらそれで成功なんです
- 42 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:01:38.322 ID:Wbi+ciuO0.net
- >>39
一番手軽なのはC++だろうけど、プログラミングやった事ないんじゃ覚える事多い
PCは多分Windowsだろ?プログラミングの環境構築がダルいからバッチ使うとかなんじゃないかな?
- 43 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:02:16.956 ID:4mevbkuc0.net
- その気になればExcelでできそう
- 44 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:02:23.635 ID:eZpBqQRRa.net
- >>42
あー難しい
- 45 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:02:30.783 ID:oBe2A0KK0.net
- テキストエディタで開いて3行目という意味でないところがみそなのかな
- 46 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:03:10.908 ID:250npxaF0.net
- 移行専用のプログラムがあるよ
wordpressなら、
- 47 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:03:18.382 ID:eZpBqQRRa.net
- >>45
あーどの行がどれなのかさっぱりわからんです
- 48 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:03:55.271 ID:iOGEdti90.net
- html5なら簡単にいけそうな気するけど
- 49 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:04:50.763 ID:eZpBqQRRa.net
- >>46
そんなの去年ブログ終わるからってスレ何回も立てたのに無能しかこなかったからほんとになんとかデータだけぶっこ抜けてヤッターだったのに去年教えてくれよおおお
- 50 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:05:02.204 ID:J16kQHem0.net
- >>41
仕事じゃないしデータも取れてるならゆっくりやれやー
なんでリネームしたいのかイマイチ分からんけど
- 51 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:05:05.416 ID:eZpBqQRRa.net
- >>48
簡単に頼みます
- 52 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:05:27.894 ID:1uYhV+lp0.net
- 偉そうに言ってる人適当に組んでここにソース貼ればいいのに
数行だろこんなの
- 53 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:05:50.885 ID:eZpBqQRRa.net
- >>50
タイトルがランダムな文字列でどの日記なのかさっぱりわからんのですよ
- 54 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:05:59.707 ID:ofUp+uZU0.net
- ファイルを新鯖にうpして
foreach(glob( フォルダ/*.html" ) as $file){
タイトルちゅうしゅつして適当に<a>タグつくって出力しろ
}
- 55 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:06:18.620 ID:eZpBqQRRa.net
- >>52
そんな簡単なのかよ…
- 56 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:06:38.076 ID:1UOXpEbI0.net
- まずは問題を切り分けましょう
grepなりで、
今のファイル名,titleタグの行
の一覧を作るところからです
- 57 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:06:40.088 .net
- 千個も頑張ったの・・・
- 58 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:07:29.438 ID:4mevbkuc0.net
- こんなタグがあって
<title>〇〇〇</title>
ファイル名を〇〇〇.htmlにしたいって事だよね
- 59 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:07:39.403 ID:eZpBqQRRa.net
- >>54
あー半分以上理解出来んです
またネットでブログ出来るってのもいいですね諦めてましたわ
- 60 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:08:09.659 ID:0kl2zB4/0.net
- リネーム系のソフトで出来るべ
- 61 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:08:21.558 ID:1uYhV+lp0.net
- >>55
俺はやりかたしらんけど口で三行で説明できることはプログラムも三行くらいだぞ
あるフォルダにあるファイルの三行目を抽出する
それをファイル名にリネームする
次のファイルを見る
全部終わったら終了
これをそれぞれの言語で書けばよい
- 62 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:08:37.103 ID:eZpBqQRRa.net
- >>58
そうですあと日付も
- 63 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:09:09.332 ID:eZpBqQRRa.net
- >>61
くううえ
ハッカーてすげー
- 64 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:09:42.426 ID:eZpBqQRRa.net
- >>60
例えばどんなソフトが?
- 65 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:10:33.725 ID:1fptmbbf0.net
- >>62
日付は投稿日ってことだよね
投稿日の情報は3行目以外のところにあるの?
- 66 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:10:48.081 ID:eZpBqQRRa.net
- あーまじでプログラム出来たいなぁ!!!
なんかいろいろな馬鹿みたいに時間かけてたことが数分で終わってた気がする
- 67 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:10:58.022 ID:1UOXpEbI0.net
- 待て待てお前らなんでビルド環境なり実行環境なり作れる前提で話すんだ
- 68 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:11:44.934 ID:oBe2A0KK0.net
- エンコードも自動識別するように作るんだよね?
- 69 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:11:59.502 ID:VsjWAEIz0.net
- sakuraなどのテキストエディタを使ってgrepする
grep結果を編集してファイルリネームコマンドを作成する
リネームコマンド実行する
これならプログラム書けなくてもテキストエディタの編集ができればいける
- 70 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:12:08.257 ID:ofUp+uZU0.net
- <a href=ファイルパス>タイトル○○○</a>
日付はたぶんブログからhtml抜いてきた時間に上書きされてるだろうから無理じゃね
html内に記述してあるならいけるけど
- 71 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:12:14.037 ID:A4TIWQl00.net
- for file_name in file_name_list:
____f = open(file_name, 'r')
____text = f.readlines()
____os.rename(file_name, text[2])
こんな感じだろ
- 72 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:13:15.868 ID:1UOXpEbI0.net
- >>69
俺もまずこれ考えた
- 73 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:13:15.937 ID:eZpBqQRRa.net
- >>65
日付の下にタイトルあります
- 74 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:14:39.128 ID:QimkzFgBM.net
- よく分からんけどとりあえずこのスレは残しとこう
- 75 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:14:44.832 ID:eZpBqQRRa.net
- ちなみにこれでいいですかね
https://i.imgur.com/kbEpuSm.jpg
- 76 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:15:25.600 ID:ofUp+uZU0.net
- タイトル.htmlなんかして日本語ファイル名なんかにしたら
対応してない鯖あるから気をつけろよ
- 77 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:16:45.867 ID:0kl2zB4/0.net
- >>64
リネーム html タグ とかで検索すりゃ出るべ
- 78 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:16:58.376 ID:ofUp+uZU0.net
- ヘッダみせんかい
- 79 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:17:06.134 ID:eZpBqQRRa.net
- >>77
まじすか!
- 80 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:17:16.775 ID:rAnkxRKt0.net
- なんて買い物上手
- 81 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:20:11.178 ID:eZpBqQRRa.net
- おーすげえ!
これがヘッダか
カーソル当てると該当するとこが出るのか
https://i.imgur.com/8EKh6B2.jpg
- 82 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:22:16.397 ID:8h3zSQwKM.net
- bat書いてあげようかと思ってdosコマンドググったけどあきらめた
dosってこんな使いづらいのね
- 83 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:23:40.892 ID:1+WAUg1g0.net
- プログラマーだけど呼んだ?
- 84 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:23:51.570 ID:J16kQHem0.net
- それブラウザが解釈したhtmlだから
ブッコ抜いたhtmlファイルをテキストエディタで開いてみたほうがいいぞ
- 85 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:24:21.171 ID:eZpBqQRRa.net
- >>83
はいこちらでーす
- 86 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:25:22.357 ID:eZpBqQRRa.net
- >>84
テキストエディタってなんでしたっけ
- 87 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:30:56.152 ID:eZpBqQRRa.net
- >>71
これどう使うんですか?
>>70
記述はしてありますね
>>69
そのsakuraつかえばいけそうですね
- 88 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:31:11.476 ID:4mevbkuc0.net
- サクラエディタをいれてみよう
Grepとか正規表現とか覚えるとくそ便利なツールだよ
- 89 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:34:07.894 ID:eZpBqQRRa.net
- >>88
なんかこれで他にも出来そうな気がしてきた
- 90 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:34:16.629 ID:clP6Q37k0.net
- findとsedだけでできそう
- 91 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:35:14.328 ID:YmYigBkr0.net
- どういうふうに置換すればいいか知りたいからファイル一つうpして
- 92 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:35:21.157 ID:eZpBqQRRa.net
- なんだやっぱりハッカーごろごろいるんだな…
- 93 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:35:45.894 ID:mtmDZRAm0.net
- sakuraでgrepして現ファイル名とヘッダタグの一覧作ってリネームコマンドのバッチ作るだけかな
ファイル名重複は頑張って直そう
- 94 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:37:59.103 ID:eZpBqQRRa.net
- >>93
出来そうだ
- 95 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:38:20.519 ID:A4TIWQl00.net
- >>87
pythonでプログラム書いたらこんな感じだけど、これスクレイピングしないといけないわ
タグあるだろ?それをidやらclassやら要素名やら使って記事タイトルの文字を絞り込むんや
このプログラムはまだ機能しないしテストしてないが一応貼っとく
import glob
import os
from bs4 import BeautifulSoup
folder_path = "source"
output_folder_path = "output"
file_path_list = glob.glob(folder_path + "/*.txt")
for file_path in file_path_list:
f = open(file_path, 'r')
text = f.read()
soup = BeautifulSoup(text, 'html.parser')
title = soup.find('title').get_text() ←ここをよしなに書き換え
with open(os.path.join(output_folder_path, title + '.html'), mode='w') as f:
f.write(text)
- 96 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:39:40.179 ID:eZpBqQRRa.net
- >>95
ありがとうございますがこれどう使うの
- 97 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:42:40.853 ID:eZpBqQRRa.net
- grepはどこからやるんだこれ
- 98 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:42:47.268 ID:mtmDZRAm0.net
- Pythonって実行環境いらんの?
- 99 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:43:15.794 ID:mtmDZRAm0.net
- ctrl+gで出せるよ
- 100 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:43:29.112 ID:1SarU5R8p.net
- 3行目ってそういうことか
正規表現でもできそうだけどhtmlパーサー使った方が確実だと思う
- 101 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:44:16.398 ID:ofUp+uZU0.net
- もう一度聞くが
タイトルに日本語入ってる?タイトル.htmlなんかして大丈夫な鯖?
- 102 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:44:35.802 ID:gpufVIbk0.net
- みんな何言ってるのかぼんやりしかわかんないけど、なんかとても面白いね、このスレ
- 103 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:47:06.783 ID:eZpBqQRRa.net
- >>101
いまのタイトルは英数字のランダムで付けたいタイトルは日付と日本語です
鯖というかもう自分のHDDにファイルで持ってるだけです
- 104 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:48:03.006 ID:eZpBqQRRa.net
- >>102
こんなにプログラムできる人がいるってちょっとびっくりだわ
- 105 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:50:31.879 ID:eZpBqQRRa.net
- あーsakuraエディターわからん
いろんなことできそうだけど女の子がわかりやすく説明してくれる参考書ほしい
- 106 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:50:52.414 ID:ofUp+uZU0.net
- もう一度サイト開くわけじゃないのか安心した
元ファイルそのまま使って<title>と日付で管理する疑似WPみたいなことしたいのかと勘違いしてた
じゃあPythonとか勉強したほうが早そうだな
- 107 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:51:01.059 ID:eZpBqQRRa.net
- とりあえずみなさんありがとうございました
sakuraエディターなりこのスレ保存してなんとかやっていきますわ
- 108 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:51:55.310 ID:eZpBqQRRa.net
- >>106
この機会にPython勉強しますわ
Python勉強したらスマホアプリ作れるんでしたっけ?
- 109 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:52:48.789 ID:1+WAUg1g0.net
- >>107
まだ解決してないのにそのままでいいのか
- 110 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:53:12.516 ID:gpufVIbk0.net
- 15年もブログを書き続けてたのもすごいね
スレ主が満足いく結果を得られるように応援してるよー
- 111 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:53:18.468 ID:sjPrqcPJ0.net
- pythonってやつインストールして>>95のスクリプト動かせばいいと思う
- 112 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:53:47.263 ID:mtmDZRAm0.net
- 急いでる訳じゃないんだろ
- 113 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:54:27.398 ID:Xgy+ievi0.net
- たぶんこれが一番はやいとおもいます
find . -maxdepth 1 -type f -exec sed -i -e '1a\{}' {} \;
- 114 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:54:32.114 ID:eZpBqQRRa.net
- >>110
去年急にサービス終了って言うから慌ててぶっこ抜けるソフト探しまくって抜けたからよかったけどほんど死ぬかと思ったよ
- 115 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:54:49.256 ID:eZpBqQRRa.net
- >>109
まあぼちぼちやっていきますわ
- 116 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:55:26.392 ID:eZpBqQRRa.net
- >>111
ええ?もうこれで終わってるんですか?
えええ!!
- 117 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:55:40.003 ID:Xgy+ievi0.net
- 3行目だったか ならこう
find . -maxdepth 1 -type f -exec sed -i -e '3a\{}' {} \;
- 118 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:56:16.020 ID:A4TIWQl00.net
- >>107
とりあえず書いた
動くかもしれないが俺のプログラムはたいていバグってるのでバグってても許してくれ
CSSセレクタで抽出なら簡単にできるかもしれない
https://gammasoft.jp/support/css-selector-for-python-web-scraping/
下のプログラムは入出力フォルダのパスとセレクタ入れると動くつもりだから参考にしてくれ
import glob
import os
from bs4 import BeautifulSoup
folder_path = "test"
output_folder_path = "output"
file_path_list = glob.glob(folder_path + "/*.html")
for file_path in file_path_list:
____f = open(file_path, 'r')
____text = f.read()
____soup = BeautifulSoup(text, 'html.parser')
____title = soup.select('ここにCSSセレクタ').get_text()
____with open(os.path.join(output_folder_path, title + '.html'), mode='w') as f:
________f.write(text)
- 119 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:56:31.211 ID:1+WAUg1g0.net
- >>115
そうか
スクリプト書いてたけどこれはいらないんだな
じゃあな
- 120 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:57:53.984 ID:eZpBqQRRa.net
- >>117
3行目と言っても本文の3行目なのであれですけど
これはどこで動かすんです?
- 121 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:59:12.091 ID:1fptmbbf0.net
- >>116
ブログタイトルがtitleタグの中じゃなくてbody内だからそのコードはそのまま使えないけど
PythonとBeautiful Soup勉強してそのコードをベースに書いてみたらできると思うよ
- 122 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 02:59:44.953 ID:eZpBqQRRa.net
- >>118
ありがとうございます
こんなのこの短時間で書いたんすか!!??CSSインストールしてこれ入れたらいいんすか?
- 123 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:00:11.033 ID:eZpBqQRRa.net
- >>121
ありがとうございます
保存しておきます
- 124 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:01:41.224 ID:1+WAUg1g0.net
- >>118
<hr>の下の日付と<br>の下のドラクエ5を入れたいらしいぞ
>>81の画像見たら分かるけど
- 125 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:02:19.208 ID:sV26sC3O0.net
- @プロンプトでhtmlファイルを検索してファイル名とパスのリストを作る
Aそのリストで3行目を出力するマクロ組んで3行目の文字列のリストを作る
B@のリストに3行目のリストを結合してファイル名から3行目の文字列にファイル名を変更するマクロを組む
マクロは環境によって変わるけどまぁ頑張れ
- 126 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:02:24.180 ID:Xgy+ievi0.net
- いちおう解説しておきます
「find . -maxdepth 1 -type f -exec コマンド \;」 で 「今いる階層のすべてのファイルに対してコマンドを実行」 です
「sed -i -e '3a\{}' {}」 は 「そのファイルの3行目にファイル名の文字列を差し込む」 です
なので「find . -maxdepth 1 -type f -exec sed -i -e '3a\{}' {} \;」の1行で完了です 微妙に要件が違う場合も sed のオプションで調整できるかと
>>120
少なくともbash環境ならどこでも動きます いまなら git for windows を入れるだけでいいです
インストールするだけなのでプログラミング言語を入れるよりはかんたんですよ
- 127 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:03:04.420 ID:A4TIWQl00.net
- >>122
CSSのやつはこっちだった chromeのやり方
https://lets-hack.tech/programming/languages/python/html-parse/
pythonの動かし方はググってくれ
コマンドプロンプトでも動くしwindowsストアからubuntu入れても動く
そんでpip install beautifulsoup4でスクレイピングのプログラムを入れてから動かしてくれ
5chはスペース消えるからハイフンにして貼ってるから置換してくれ
正常に動くとは言ってないからな!python勉強汁!
- 128 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:03:44.340 ID:eZpBqQRRa.net
- >>125
なんかいろんなやりかたあるんですね…
- 129 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:06:14.805 ID:mtmDZRAm0.net
- ちなみに>>81の画像で言うとどれをファイル名にしたいんだ?
- 130 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:06:48.684 ID:eZpBqQRRa.net
- >>127
ありがとうございます
きっと理解できるのは数年後かもしれません
>>126
やってみます
- 131 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:07:36.075 ID:eZpBqQRRa.net
- >>129
左上にある日付とドラクエ5です
- 132 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:09:37.242 ID:sjPrqcPJ0.net
- htmlファイルをzipで斧とかに上げて誰かにやってもらうのが一番手っ取り早そうだな
- 133 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:10:49.638 ID:Umh0giR4a.net
- bash使うのが速そうだな 行抽出して文字列操作してリネーム
- 134 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:10:59.449 ID:eZpBqQRRa.net
- いまだけで4つもソフトインストールしててワロタ
- 135 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:11:42.540 ID:eZpBqQRRa.net
- ソフト開いてそっ閉じの連続だぜえ
- 136 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:11:50.817 ID:ofUp+uZU0.net
- どっちにもタグ付いてないから
怖いけど行をそのまま使うパワープレイするしかないのか
- 137 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:12:09.514 ID:YmYigBkr0.net
- 今アプリ作ったんだけどどんな文字列を置換すればいいのかわからないからhtmlアップしてくれ
- 138 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:12:14.507 ID:mtmDZRAm0.net
- >>131
3行目と6行目結合してファイル名に使えない文字置換してリネームだな
お前らやること増えたぞがんばれ
- 139 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:12:17.516 ID:j7rYcmCHa.net
- VIPのプログラミングDiscordあるからそこで聞いてもいいと思う
- 140 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:13:52.565 ID:eZpBqQRRa.net
- >>137
え?
どう上げたらいいですか
画像しか上げたことないんですが
- 141 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:14:01.146 ID:VsjWAEIz0.net
- ちなみにサクラエディタ使うなら
Altキー押しながらマウスで範囲選択は絶対に覚えておくべき
grep結果の編集が捗る
- 142 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:14:43.304 ID:eZpBqQRRa.net
- >>141
なるほど
- 143 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:14:51.925 ID:Xgy+ievi0.net
- >>133
この手のファイルの一括操作なんかはshが最適化されてるよね
言語つかってもそりゃできるけど直にシェル触れるやつがだいたいはやいです
わたしはもう寝ますんでわからんくなったら他の方法でやってみてください
- 144 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:15:14.156 ID:YmYigBkr0.net
- >>140
ここにzipであげてくれ
https://www.axfc.net/uploader/
- 145 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:20:53.716 ID:eZpBqQRRa.net
- >>144
アップロード失敗するんですけどなんで
- 146 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:21:15.846 ID:eZpBqQRRa.net
- >>143
ありがとうございました
- 147 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:24:05.726 ID:YmYigBkr0.net
- >>145
https://www.axfc.net/u/post.pl
ここから必要であれば削除パスワードとかDLキーワードとかを入力して次のページでアップできない?
- 148 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:25:00.219 ID:Wbi+ciuO0.net
- nodeで書いてみたけど、どの道使えないだろうから無意味だったわ
- 149 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:28:14.333 ID:eZpBqQRRa.net
- なんか失敗します
まあほんとありがとうございます
このスレ残してボチボチやりますみなさん感謝します
https://i.imgur.com/vI05Ebm.jpg
- 150 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:28:31.489 ID:VsjWAEIz0.net
- サクラエディタのgrepはCtrl+Gキーで起動
条件に検索ワードを指定、フォルダを選択して、検索ボタン
- 151 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:29:31.877 ID:A4TIWQl00.net
- >>118
これ動作確認したら動いた
ただ一箇所だけバグってた以下が正しい
title = soup.select('ここにCSSセレクタ')[0].get_text()
これで全部いけると思う
- 152 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:29:50.138 ID:eZpBqQRRa.net
- >>150
一行長すぎてどの単語からいけばいいのかわからんのです
- 153 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:30:45.210 ID:eZpBqQRRa.net
- Pythonがなんか立ち上がらんです…
- 154 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:32:32.606 ID:YmYigBkr0.net
- >>149
せっかく作ったからやらせてくれ!!!!!
他のロダも試してみて
https://gigafile.nu/
https://firestorage.jp/sp/
- 155 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:32:39.173 ID:A4TIWQl00.net
- >>153
pythonはどう入れた?
ubuntuでやってないならubuntuの方が多分簡単
windowsストアでまずインスコしてみて
- 156 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:33:44.210 ID:eZpBqQRRa.net
- >>155
Windows7なんですよね…
- 157 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:34:16.673 ID:VsjWAEIz0.net
- ああ、今ちゃんと>>81のソースみたけど
grepじゃ無理だな
- 158 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:35:02.357 ID:eZpBqQRRa.net
- https://xfs.jp/FQCAft
いけた
- 159 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:36:54.871 ID:A4TIWQl00.net
- >>156
あっ
windows7はちょい面倒かもなぁ…
- 160 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:37:37.496 ID:A4TIWQl00.net
- >>156
こことか参考にならないか
https://qiita.com/yuu116atlab/items/79f92dd38b79364b8e68
- 161 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:37:41.880 ID:eZpBqQRRa.net
- >>155
Ubuntu昔やってました
なんかパッチとかで断念しました
- 162 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:41:40.243 ID:eZpBqQRRa.net
- >>160
おーありますね
インストールできましたわ
これでおれもPython使いか!
- 163 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:43:16.905 ID:eZpBqQRRa.net
- >>160
あれ?Pythonて真っ黒?
- 164 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:43:35.455 ID:A4TIWQl00.net
- >>162
おっ できたか
python --versionってコマンド打って動くか確認してみてくれ
- 165 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:48:18.463 ID:eZpBqQRRa.net
- >>164
これってコピペできないんですか?
- 166 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:51:39.000 ID:DO5k3fV40.net
- なんでVBScriptでHey Scripting Guy!みればできる事なのにPythonなんて…
- 167 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:51:51.226 ID:A4TIWQl00.net
- >>165
右クリックでできるよ
- 168 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:52:00.560 ID:eZpBqQRRa.net
- >>164
これであってます?
https://i.imgur.com/8JL7d0A.jpg
- 169 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:52:38.771 ID:eZpBqQRRa.net
- >>167
右クリックできないです
おかしいな
- 170 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:53:34.141 ID:eZpBqQRRa.net
- >>154
ちなみにどうですか?
- 171 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:53:46.480 ID:VsjWAEIz0.net
- HTML見たけど「ドラクエ5」を拾いたいのに、タグで囲ってないからセレクタで拾えない
はっきりいってかなりめんどくさい
- 172 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:54:28.205 ID:eZpBqQRRa.net
- なるほどめんどくさいのかこれ
- 173 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:55:34.260 ID:eZpBqQRRa.net
- これできるようにPythonとsakuraエディターとほかのレスしてもらったやつとかとやって行ったら同時に勉強できそうでワクワクするw
- 174 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:56:31.716 ID:0TPlKSJu0.net
- >>75
そんなしょーもないブログをアーカイブすることに何の意味があるの。
- 175 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:57:23.128 ID:A4TIWQl00.net
- >>168
おーけー
黒い画面一回閉じてまた開いて以下を貼り付けて実行してくれ
pip install beautifulsoup4
セレクタで拾えんの?
- 176 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 03:58:04.910 ID:eZpBqQRRa.net
- >>174
15年の日記があるからねえ
- 177 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 04:00:37.951 ID:eZpBqQRRa.net
- >>175
おかしいな
右クリックとかコントロールVが効かないです
- 178 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 04:01:35.956 ID:eZpBqQRRa.net
- >>175
errorってでます
- 179 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 04:02:34.001 ID:A4TIWQl00.net
- >>177
多分開いてる画面が違うわ
Winキー + R押してcmdって打ったら黒い画面出てくるから、
そこにpython --versionをコピペしたら動く?
- 180 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 04:04:44.472 ID:eZpBqQRRa.net
- >>179
認識されてませんてでます
おかしいな
- 181 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 04:07:03.557 ID:b3t/hE++0.net
- PythonのPath通ってないとかかな?
インストール時に設定できた気がするけど
- 182 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 04:07:11.721 ID:eZpBqQRRa.net
- もう4時ですね
みなさんほんとありがとうございます
風呂入ります
- 183 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 04:10:53.915 ID:A4TIWQl00.net
- >>180
パス通す設定で再インストールかな…
- 184 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 04:24:42.869 ID:A4TIWQl00.net
- 使い方書いてうpしたから置いとくね
がんばって
https://xfs.jp/hJ4kwc
- 185 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 04:29:33.227 ID:eZpBqQRRa.net
- >>183
またやりますわw
>>184
おーありがとうございます
- 186 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 04:30:34.340 ID:eZpBqQRRa.net
- みなさんどうも
このスレ熟読して勉強しますありがとうございました
- 187 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 04:35:29.813 ID:YmYigBkr0.net
- おくれてすまん
アプリできたからhtml全部送ってくれればこっちで変換するよ
- 188 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 04:37:08.347 ID:YmYigBkr0.net
- >>158のファイルだけでしか試せないからこの置換方法で全部できるかはわからないけど
- 189 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 04:38:15.288 ID:eZpBqQRRa.net
- >>187
全部はちょっと…
アプリってもらえないです?
- 190 :高岡由佳 :2021/02/12(金) 04:44:11.479 ID:LLDhRiPn0.net
- そもそもやろうとしていること自体がアホ
全部DBに突っ込め
それか単一のExcelにでもしてろ
- 191 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 04:46:53.845 ID:eZpBqQRRa.net
- ドラゴンボールですか?と書こうとしたらデータベースとわかったけどデータベースってなんですか?
- 192 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 04:48:01.487 ID:eZpBqQRRa.net
- でも昨日の昼ワードかExcelで1つにまとめようかと思ったんだよね
それよりタイトル変えた方が早いかなとおもってそこからのこのスレ
- 193 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 04:49:28.198 ID:YmYigBkr0.net
- >>189
https://xfs.jp/Jh7XGW
htmlファイルを一つのフォルダに入れてそのフォルダパスをアプリに張り付けてボタン押すとデスクトップに「ファイル名変換」ってフォルダが作成されてリネームしたhtmlが作成される
- 194 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 04:59:10.156 ID:eZpBqQRRa.net
- >>193
うわ!できました!!!!!!!
- 195 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 05:04:02.492 ID:eZpBqQRRa.net
- うわ!すっげえええええ
- 196 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 05:07:33.989 ID:YmYigBkr0.net
- おおよかった
ちなみにこのアプリはC#っていうプログラミング言語で作ったから興味あったら調べてみて
これくらいのアプリなら割とすぐ作れるようになると思うから
- 197 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 05:09:34.297 ID:eZpBqQRRa.net
- >>196
感謝します!!!
この中身もものすごく気になるので勉強します
遅くまでありがとうございます!!
- 198 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 05:14:15.560 ID:eZpBqQRRa.net
- 全部一瞬にして変わった…
- 199 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 05:25:20.970 ID:pfmTaD9k0.net
- こういうスレほんと口だけのやつ多いな…
- 200 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 05:26:10.539 ID:eZpBqQRRa.net
- お礼をしたいけどなんもできん…
- 201 :以下、?ちゃんねるからVIPがお送りします:2021/02/12(金) 06:10:38.196 ID:EmDScJcSM.net
- ほんわかVIP
総レス数 201
48 KB
掲示板に戻る
全部
前100
次100
最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★