■ このスレッドは過去ログ倉庫に格納されています
Excelで300万行を速く計算する方法
- 1 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:53:30.277 ID:Wy5eu6rW0.net
- 昨日は寝てた
すまん
- 2 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:53:46.569 ID:d6Csh/kFa.net
- どういうこと?
- 3 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:54:25.971 ID:d6Csh/kFa.net
- Excelっていうか、データが300万行あるってこと?
それをExcelで読ませて計算したい?
- 4 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:54:32.659 ID:qPBFCghA0.net
- 普通に計算すれば良いじゃん🤗
- 5 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:54:42.454 ID:Wy5eu6rW0.net
- 数十万行のExcelファイルが複数あって
それを速く集計する方法について
- 6 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:55:18.321 ID:pxS1Q5D5M.net
- アルゴリズムを最適化するってこと?
- 7 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:55:24.833 ID:d6Csh/kFa.net
- VBA使うならできるよ
1行ずつ読み込んで、配列に格納して計算すればいい
- 8 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:56:10.395 ID:qPBFCghA0.net
- ハイスペパソコンオーバークロックして使おう
- 9 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:56:31.266 ID:Wy5eu6rW0.net
- 昨日はExcelの限界は1048576行列にだよってレスが多かったけど
複数ファイル合わせて300万行超えるよって話
- 10 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:56:36.101 ID:uqNLUd7+a.net
- なんか使う関数次第で結構差が出るんだよな
lookup系のヤツ使うと特に重くなる印象
- 11 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:56:42.149 ID:+4GTemah0.net
- 上限65Kじゃないの?
- 12 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:56:52.056 ID:Ye9mfG3g0.net
- 300万行のセルに入力するのがだるい
そしてあっているかわかるの?
- 13 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:57:27.103 ID:S42MDiy50.net
- Microsoftに課金する
- 14 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:57:41.510 ID:d6Csh/kFa.net
- 1 フォルダ配下のファイル名を取得する
2 ファイル名でループする
3 ファイルを1行ずつ読み込むループさせる
4 必要な値を配列に格納する or 計算結果を変数に格納
- 15 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:58:06.610 ID:+4GTemah0.net
- 足し算引き算なら余裕じゃないの?
- 16 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:58:14.281 ID:Wy5eu6rW0.net
- 元データ全部合わせると300万行超えるけど
集計したら数千行で収まります
- 17 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:58:22.851 ID:poydRE4o0.net
- スパコン買ってくる
- 18 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:58:46.052 ID:d6Csh/kFa.net
- >>12
だいたいこういうのビックデータ分析だからデータはあっているものとするんじゃない?
俺は1日3000万件収集されるビックデータを分析するために簡易的にVBA使ってた
- 19 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:59:02.283 ID:wrFuTcAj0.net
- てか一回部位ルックして計算し終えたら
それをメモ帳に張り付けて関数消す
そのあとメモ帳コピってはりつけるだけで相当速くなる
- 20 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:59:33.149 ID:d6Csh/kFa.net
- >>19
vlookupとかクソ遅すぎて使い物にならんよ
- 21 :以下、?ちゃんねるからVIPがお送りします:2022/06/27(月) 23:59:49.341 ID:2Mb/qEyv0.net
- CSVとして結合した単一ファイルを作りExcelの存在を無視して集計する
- 22 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:00:27.845 ID:/pn7F43j0.net
- ADOでテーブルに入れてに計算すれば
- 23 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:00:47.556 ID:a0M/NbKk0.net
- 今やってる事
1つのフォルダに数十万行のExcelファイルが複数ある
それをQueryで一つに集計する
集計はQueryが行うけどSUMIFSと同じようなイメージ
- 24 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:01:32.434 ID:hQYtVbDF0.net
- >>21
俺もこれかな
またはAccessで瞬殺かな
- 25 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:01:46.766 ID:DwyGFgbo0.net
- >>19
範囲選択してコピーしてそのまま値だけ貼り付けでよくね
- 26 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:03:54.080 ID:a0M/NbKk0.net
- VLOOKUPって言う人多いけど365だからもう使わないです
元データを1つのフォルダにぶっこんであとはQueryが勝手に計算する
- 27 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:04:58.814 ID:3uzmQQWw0.net
- vbaって大量データの場合重いよね
c#でコード書いてる
- 28 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:05:26.367 ID:a0M/NbKk0.net
- PowerQueryとPowerPivotの組み合わせ
いわゆるモダンExcelでもかなり遅い
- 29 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:05:47.671 ID:n5zw0qusM.net
- mysqlに格納しろ
- 30 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:06:17.762 ID:a0M/NbKk0.net
- >>27
昨日はC++が秒殺だよっていうレス見たけどどうなのかな
- 31 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:06:19.881 ID:ZAPiHnFn0.net
- Queryってなんのこと言ってんの
DBのクエリ?LINQ?EXCELファイルをインポートしたDataTableで加工すんの?
- 32 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:07:18.043 ID:a0M/NbKk0.net
- >>31
ExcelのPowerQuery
- 33 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:07:51.836 ID:sjech6tla.net
- よく分からんけど何のデータ?
- 34 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:09:23.896 ID:hX4DG6It0.net
- Webスクレイピングでサイトから撮ってきたデータを一行ずつ処理してるんだけどそれで1分くらいかかるわ
もう少し最適化したい
- 35 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:09:57.001 ID:a0M/NbKk0.net
- >>33
コード 名前 数
の3列が1ファイルに数十万行ある
コードは全部で1万種類くらい
データが100万行あっても集計したら1万行になるはず
- 36 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:11:09.318 ID:TpwxWCgsM.net
- てかさっさとかけよ
>>1の時点で書いとけ
- 37 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:11:21.623 ID:a0M/NbKk0.net
- コード=名前という認識でOK
- 38 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:13:08.158 ID:a0M/NbKk0.net
- モダンExcelだと遅い
速く計算したい
ワークシート関数だともっと遅い
- 39 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:13:43.305 ID:B6WU0DLi0.net
- Rustで書けよ
- 40 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:14:06.473 ID:Djd8S1i30.net
- そんなシンプルなデータをExcelにしてる時点で管理がウンコだな
明日からcsvにしろ
- 41 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:14:34.660 ID:ER9NoOwj0.net
- >>11
昔は2^16だったけど今は増えた
- 42 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:14:35.944 ID:a0M/NbKk0.net
- >>39
すまん
プログラミングはサッパリわからん
- 43 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:15:10.891 ID:B6WU0DLi0.net
- プログラミングわからんなら300万行に手を出すなよ
- 44 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:15:15.095 ID:ER9NoOwj0.net
- csvに書き出してpythonとかでやれば?
- 45 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:15:32.631 ID:a0M/NbKk0.net
- >>40
csvなら速いか?
300万行でも楽々?
- 46 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:16:43.783 ID:B6WU0DLi0.net
- 計算できるかは知らんけどsakuraで正規表現で必要なデータだけトリムしてExcelに貼れば?
- 47 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:16:50.829 ID:a0M/NbKk0.net
- >>43
すまーん
- 48 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:17:46.020 ID:a0M/NbKk0.net
- >>46
やっぱExcelデータじゃ厳しい?
- 49 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:18:01.744 ID:a0M/NbKk0.net
- >>44
Pythonわかんなーい
- 50 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:18:15.815 ID:lcpnpxg20.net
- GPU支援を有効にする
- 51 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:18:28.044 ID:n5zw0qusM.net
- 表計算ソフトに万単位求めんな
- 52 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:19:20.332 ID:rwTtFmHa0.net
- 難しい事考えないでお勉強しなさい
- 53 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:20:23.484 ID:B6WU0DLi0.net
- >>48
つーか情報小出しだし要件が全く不明
わざとじゃないなら300万行処理できる知性に達してない
- 54 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:21:41.953 ID:oDKwSPh4M.net
- CSVにしてEmEditorでやれ
300万くらいなら十秒もかからんぞ
- 55 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:22:40.596 ID:/pn7F43j0.net
- こんなところでウダウダ聞くより何でもいいからプログラム覚えた方が早いんじゃね
- 56 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:22:55.064 ID:a0M/NbKk0.net
- >>54
お!調べてみる
ありがとう!
- 57 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:23:30.224 ID:a0M/NbKk0.net
- >>53
PowerQueryはわかる?
- 58 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:23:34.083 ID:B6WU0DLi0.net
- 一回CSVにしてからテキストエディタに読み出して10万行刻みにExcelに貼り付けて集計していけばいいじゃん
- 59 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:28:00.097 ID:fv/g32ww0.net
- Excelのクエリ知らないのが多いからここで聞いても無駄
- 60 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:30:49.271 ID:a0M/NbKk0.net
- PowerQueryとPowerPivotならわる
スピルも使える
Queryとスピルの組み合わせが良いと思うんだけど
- 61 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:32:55.960 ID:fv/g32ww0.net
- クエリのマージを多用すると重くなる
グループ化ならいいけどマージはワークシートでやるのがオススメ
- 62 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:34:47.577 ID:a0M/NbKk0.net
- >>58
Query一発じゃだめなのか?
- 63 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:35:35.954 ID:a0M/NbKk0.net
- >>61
マージは数カ所やってたわ
変えてみる
- 64 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 00:55:07.277 ID:CmTUGn5+0.net
- 筆算する
- 65 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 01:08:39.347 ID:KlQwxkE30.net
- Python派だな
めちゃくちゃはえーぞ
- 66 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 01:36:47.802 ID:bqqq171md.net
- 一言で言うとsql使え
最低でもjqとか
演算速度がダンチすぎる
- 67 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 01:37:35.091 ID:bqqq171md.net
- >>65
pandaいいよな
- 68 :以下、?ちゃんねるからVIPがお送りします:2022/06/28(火) 01:51:35 ID:hFSLJnGh0.net
- 何でわざわざエクセルなんだよ
アクセスでもなんでもあるだろ
総レス数 68
13 KB
掲示板に戻る
全部
前100
次100
最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★