自動翻訳されています。元の投稿を表示する

3.機械学習における主要なリサンプリング技術

正確であるようにモデルを訓練しました。。。 十分じゃない

同様に重要なことは

👉、モデルの輝きを正しい方法で測定しましたか?

多くの場合、モデルは正確に見えます。

そのデータセットとの偶然かもしれません。

しかし、新しい情報を見つけると、簡単に壊れてしまいます。

このビジュアルノートは要約されています。

3.機械学習における主要なリサンプリング技術

そのデータサイエンティストは実際にモデルを評価するために使用しました。

LOOCV、BootstrapからK-Fold Cross Validationまで

それぞれの方法が私たちを可能にします

✔️データが限られている場合は、より多くのデータを使用してください

✔️自分を欺くのではなく、モデルをより公平に評価します。

✔️長期的な過剰適合のリスクを減らします。

のために非常に適した

•機械学習を勉強している人

•検証の基盤を強化したいデータワーカー

•または、どの方法を選ぶべきか「混乱している」人。

📚このビジュアルノートは

クラスデータサイエンスブートキャンプモデル12

DataRockieのページで。

MLを勉強している人やデータラインに取り組んでいる人は誰ですか?

レビューのために保存してください。📌💙

#ビジュアルノート #ビジュアルノート

#マシンラーニング #データサイエンス #リサンプリング

1/18 に編集しました

... もっと見るหลายคนเทรนโมเดลแล้วได้คะแนนดีมาก แต่พอเอาไปเจอข้อมูลใหม่กลับแย่…ปัญหานี้มักเกิดจากการ “ประเมินโมเดล” ที่ยังไม่แฟร์พอ ซึ่งนี่แหละคือเหตุผลที่ต้องรู้ว่า resampling คืออะไรใน machine learning Resampling (การสุ่ม/แบ่งข้อมูลซ้ำเพื่อประเมินโมเดล) คือเทคนิคที่ช่วยให้เราประมาณความสามารถในการ generalize ของโมเดลได้ดีขึ้น โดยไม่ต้องมีชุดข้อมูลใหม่เพิ่มทันที พูดง่าย ๆ คือทำให้การวัดผลไม่หลอกตัวเอง และช่วยลดความเสี่ยง overfitting ในระยะยาว ต่อไปนี้คือภาพรวม 3 เทคนิคหลักที่เจอบ่อย และทริคเลือกใช้ (รวมถึงคำถามยอดฮิตเรื่อง “แบบไหนใช้เวลาเทรนนานที่สุดถ้า n=10000”) 1) Leave-One-Out Cross Validation (LOOCV) หลักการ: ถ้ามีข้อมูล n ตัวอย่าง จะเทรนด้วย n-1 และทดสอบด้วย 1 ทำซ้ำจนครบ n รอบ (เท่ากับเทรนโมเดล n ครั้ง) ข้อดี: ใช้ข้อมูลฝั่งเทรนได้เกือบทั้งหมดในแต่ละรอบ เหมาะเวลาข้อมูลน้อยมาก ๆ ข้อเสีย: ใช้เวลามาก เพราะต้องฟิตโมเดลซ้ำเยอะ และค่าประเมินอาจมี variance สูงในบางปัญหา คำถาม: resampling แบบใดที่ใช้เวลาเทรนโมเดลนานที่สุดถ้า n=10000? คำตอบโดยทั่วไป: LOOCV มักนานที่สุด เพราะต้องเทรน 10,000 ครั้ง (ถ้าโมเดลเทรนช้า ยิ่งชัด) 2) Bootstrap (Sampling with Replacement) หลักการ: สุ่มตัวอย่างจากชุดเดิมแบบ “คืนกลับ” ให้ได้ชุดเทรนขนาดเท่าเดิม แล้วประเมินซ้ำหลายรอบ (เช่น 200–1000 รอบ) บางครั้งใช้แนวคิด out-of-bag (ตัวอย่างที่ไม่ได้ถูกสุ่มติดมา) เป็นชุดทดสอบ ข้อดี: ดีมากสำหรับการประมาณความไม่แน่นอน/ความแปรปรวนของตัวชี้วัด และใช้ได้กับข้อมูลจำกัด ข้อเสีย: ถ้าทำหลายรอบก็ใช้เวลามากเหมือนกัน และถ้าโจทย์ต้องการการแบ่ง train/test แบบ “สมจริง” อาจต้องเลือกวิธีให้เหมาะ 3) K-Fold Cross Validation หลักการ: แบ่งข้อมูลเป็น K ส่วน (fold) เทรน K ครั้ง โดยแต่ละครั้งใช้ 1 fold เป็น test และอีก K-1 เป็น train ข้อดี: สมดุลดีมากระหว่างความแม่นของการประเมินกับเวลาในการรัน นิยมสุดในงานจริง ข้อเสีย: ต้องระวังการจัด fold ให้ไม่รั่วข้อมูล (data leakage) และถ้าข้อมูลไม่สมดุลควรใช้ Stratified K-Fold ทริคเลือกใช้เร็ว ๆ (จากประสบการณ์ตอนทำโปรเจกต์/บ้าน ๆ) - ข้อมูลน้อยมาก: เริ่มจาก K-Fold (เช่น 5 หรือ 10) ก่อน ถ้ายังอยากใช้ข้อมูลเทรนให้คุ้มสุดค่อยพิจารณา LOOCV - ข้อมูลเยอะ (n=10000 ขึ้นไป): K-Fold มักคุ้มสุดเรื่องเวลา/คุณภาพผลลัพธ์ และตอบโจทย์งาน production - อยากรู้ความผันผวนของคะแนน/ทำช่วงความเชื่อมั่น: Bootstrap จะเด่น สุดท้าย แนะนำให้โฟกัส 2 อย่างพร้อมกัน: เลือก metric ให้ถูก (เช่น classification ที่คลาสไม่สมดุลอย่าดู accuracy อย่างเดียว) และเลือก resampling ให้เหมาะกับทรัพยากร/ลักษณะข้อมูล แค่นี้ผลประเมินโมเดลจะ “แฟร์” ขึ้นเยอะค่ะ

関連投稿

英語学習ポッドキャストの365日計画を5つのステージに分けて紹介する画像。各ステージの目標とおすすめポッドキャスト(例:BBC Learning English、All Ears English、The Daily)が示されています。
人気の英語学習ポッドキャストが難易度とジャンル別に多数表示されており、自分に合った学びを見つけられることを示唆しています。各ポッドキャストの難易度スコアも記載されています。
ポッドキャストの難易度を可視化し、ユーザーのスキルに合わせたおすすめコンテンツを診断する機能を紹介。様々なポッドキャストのアイコンが並び、レベルに応じたレコメンドが提供される様子です。
挫折しない!レベル別ポッドキャスト学習法 365日計画!
「よし、英語をやるぞ!」と意気込んで、いきなり『The Daily』などの難解な番組を聴いて撃沈していませんか? ポッドキャスト学習で一番怖いのは、自分に合わない難易度を選んでしまうことです。英語学習はゲームと同じ。ステージを一つずつクリアしてレベルアップしていくのが、挫折しない唯一の秘訣です。 そこで、365日で英語耳を作る「ステップアップ計画」をまとめました! ステージ1:適応期(1〜30日) 🎯目標: 英語の音に慣れる。キーワードを拾って「何の話をしているか」を掴む。 おすすめ: BBC Learning English / ESL Pod ✅特徴: ゆっくり、シンプル
TalkMe-AI英会話

TalkMe-AI英会話

28件の「いいね」

Webマーケティングが無料で学べるサイトTOP5
▲Webスキルを学ぶなら過去投稿もチェック!   Webマーケティングを勉強しようと思っても スクールにお金がかかってモチベが下がるよね…    そこで今回は 『Webマーケティングが無料で学べるサイトTOP5』 をご紹介します!    有料級の情報をゲットできる神サイトのみ を厳選したからぜひ参考にしてみてね!    結論からいうと、ランキングは次のとおり    ・第5位:マーケジョブ ・第4位:沈黙のWebマーケティング ・第3位:ferret ・第2位:WebマーケティングTV ・第1位:Googleデジタルワークショップ    僕もお金を使わず
ひろポンプ|宅建士クリエイター

ひろポンプ|宅建士クリエイター

114件の「いいね」

#BTC #ビットコイン 次の大底はいつ訪れるのか予測しました。 少々長いのでブックマークなどして後で読み返せるようにする事を推奨します。 先ず、ビットコインはその通貨の性質上、値動きにおいて時間軸におけるサイクルが確認出来る。 4年に1度という規則正しい材料があってこそのもので、これは他の金融商品には中々ないもの。 よって今回は横軸の規則性を活かし次の大底が訪れる時期を推測していこうと思う。 各半減期の「最高値→最安値」までにかかった日数は以下の通りだ。※添付図は週足ベースのため誤差あり 第一回目の半減期(2012年11月28日) 406
_alen

_alen

1件の「いいね」

【税務調査】売上の「異常な変動」はこう見られる
— 元国税・財務省/フリーランス・個人事業主特化税理士 ▶︎結論 個人事業主・フリーランスの方で、前年から売上が急増減(例:1100万→700万)した場合、国税のシステムが「異常」と検知し、税務調査の対象候補(一次審査突破)となります。 ▶︎調査を回避する最短フロー 1️⃣ 売上比較:前年と当年の売上を比較し、大幅な変動がないか確認する。 2️⃣ 理由の明確化:変動に正当な理由(例:病気での入院、取引先の倒産、市況の悪化など)があるか整理する。 3️⃣ 決算書に記載:確定申告の際、決算書や収支内訳書の「本年中における特殊事情」などの余白欄に、具体的な理由を明記しま
岩井淳貴|“元国税・財務省”個人事業主専門税理士

岩井淳貴|“元国税・財務省”個人事業主専門税理士

3件の「いいね」

モチベが低い受験生の脳の真実
偏差値45から医学部逆転合格。 部活は全国大会入賞。 コスパ最強勉強法を日々発信。
受験計画×現役医大生@たける

受験計画×現役医大生@たける

16件の「いいね」

須永陽咲也

須永陽咲也

102件の「いいね」

ヘアスタイリング剤のパッケージと本体が写っており、「やっと見つけた」「大容量」「香りが推し」という文字が配置されています。アイドル前髪や触角ヘア用の製品であることが示されています。
2種類の前髪用スタイリング剤と、同ブランドのシャンプー・トリートメントが並べられています。前髪ガチ勢専用とアイドル前髪触角ヘア用という用途が示されています。
前髪用スタイリング剤の香りの特徴が説明されており、香りの構成要素が図で示されています。すっきりとしたみずみずしいグリーンノートの香りが強調されています。
\2ヶ月探し続け、ようやく出会えた新作👼💚/
ずっと買いたかったアイテム、 サボンドサボタのマエガミキーパーをレビュー🫶🏻 - - - - - - - - - - - - - - - - - - - - - - - - ✄ サボンドサボタ マエガミキーパー マジカール ¥1,298(税込)18ml 紫外線や乾燥にさらされながらも、 力強く潤うサボテンの超保水力に注目した ブランド、サボンドサボタ🌵✨ 平均サイズの約2倍量※入でコスパ最強& 透明のパケで残量が見えるのもポイント💭 〈前髪ガチ勢専用 ガチキープ〉と 〈アイドル前髪触覚ヘア専用 マジカール〉 の2種類🫶🏻 2月末のイベントで知っ
Suwaコスメ紹介

Suwaコスメ紹介

128件の「いいね」

Thetawaveの録音からノート作成機能が便利
#勉強垢 #大学生の勉強法 #社会人の勉強 #ライフハック #最新ツール
蛍光ペン

蛍光ペン

3件の「いいね」

2050年までに人間、AI、ロボット技術が共進化し、AIロボットが自律的に学習・行動・修復し、人間と共生する未来を描いた図。極限環境での作業、実験自動化、研究提案など、多様な協働が示されている。
AI × ロボット技術が次に向かう先 米コインベース・ベンチャーズ(CV)が注目しているのが、 AIとロボット技術の融合がもたらす“次のインフラ進化”です。 現在、AIは急速に進化していますが、 その次のフロンティアとして期待されているのが ロボット技術 です。 特にCVは、次の3点に注目しています。 ⸻ ① ロボット技術とデータ収集の進化 高度なロボット開発には、 「人間と物理的にどう関わるか」という 高品質な実世界データが不可欠です。 しかし現状、そのデータは圧倒的に不足しています。 そこで注目されているのが DePIN(分散型物
大崎 勇

大崎 勇

0件の「いいね」

#クリエイター成長ラボ
user5195738201478

user5195738201478

0件の「いいね」

XRP底打ちの兆しか
XRP 底打ちの兆しか チャートの形は悪くない トランプコイン年末まで上昇か #暗号資産 #仮想通貨 #xrp
BTCまり 仮想通貨

BTCまり 仮想通貨

2件の「いいね」

GeminiがGoogleビジネスプロフィール連携で分析・投稿支援OK
2026年6月20日、Googleビジネスプロフィールが Gemini と連携開始。Gemini のウェブアプリに同じGoogleアカウントでログインし、設定からアプリ連携をオンにするだけで利用できる。チャットで「@Googleビジネスプロフィール」と指定すると、インサイト分析、検索キーワード抽出、クチコミの分析・返信文作成、投稿文の作成支援などが可能。実際にインプレッション数や流入キーワードを解析し、改善のヒントまで対話形式で提案してくれる。まるでコンサルティングを受けているように、Googleマップ集客に生成AIを活用できる。 詳しくは15分の動画で解説しました。 https:/
横田秀珠ネットビジネス・アナリスト

横田秀珠ネットビジネス・アナリスト

1件の「いいね」

【衝撃】新しいiPhoneに最適!U-NEXT動画見放題+スマホ代で月2,489円のエンタメ好き必見
#PR #UNEXT #UNEXTMOBILE #UNEXTモバイル U-NEXT MOBILEは、動画見放題とスマホ代がまとめて月2,489円で使える新しいサービスです。 U-NEXTの見放題作品37万本以上、雑誌210誌以上が楽しめて、20GBのデータ通信もセット。 しかも、ギガは永久繰り越しで上限100GBまでストック可能。 エンタメ好きには最高のコスパです。 U-NEXT MOBILE公式サイト https://mobile.unext.jp/ 【料金の詳細】 - U-NEXTの月額プラン:2,189円 - U-NEXT M
テック好きイシハラさん

テック好きイシハラさん

12件の「いいね」

「令和4年度技術士第二次試験問題〔建設部門〕」と書かれた試験問題用紙。2050年カーボンニュートラルに関する設問と、温室効果ガス排出量や2013年度の産業分野全体のCO2排出量に関する手書きのメモがピンク色で強調されている。
「CO2排出量削減及びCO2吸収量増加のための課題」と題された試験問題の解答用紙。インフラ施設のCO2排出量削減、郊外の車両のCO2排出量削減、緑の維持・保全・創出の3つの課題が詳細に記述されている。
セメント産業のCO2排出量に触れ、「抽出した課題のうち最も重要と考える課題と解決策」が記述された試験問題の解答用紙。インフラ施設のCO2排出量削減を最重要課題とし、環境配慮型コンクリート導入、建設機械の脱炭素化、施設共用時の低炭素化の3つの解決策が示されている。
勉強📚論文テーマ「カーボンニュートラルの実現」
技術士第二次試験 建設部門 都市及び地方計画 論文テーマ「カーボンニュートラル」 カーボンニュートラルとは 二酸化炭素などの温室効果ガスの「排出量」から 森林などによる「吸収量」を差し引いて 合計を実質ゼロにすることです。 カーボンニュートラルは 全世界で共通する国際的な目標であり 温室効果ガス排出削減を行い 地球温暖化対策を目指すものです。 そして、世界全体の温室効果ガス排出量を 実質的にゼロ(カーボンニュートラル)にすることを目標として定めたものです。 よかったら読んでみて下さいね📄𓂃✍︎ #勉強 #試験 #レポート
🍋T

🍋T

0件の「いいね」

最旬韓国コスメが試せる!貰える!買える!💗💜
K-Cosme Festival Reverb 第4弾‼️ "K-BEAUTY POP-UP"に参加してきたよ🇰🇷💄 韓国のコスメブランドが多数参加🫨💜 商品のサンプルをもらえたり、 気に入った商品があれば買うことも 可能です(キャッシュレスのみ対応)! 韓国トレンドを体験できるので 韓国好きさんにはたまらぬイベントだと思います🤭 <ブースイベントおよび販売特典> ✔️今回、初となるレバーブ(Reverb)ストアのオープンを記念して会場限定の特別な特典をご用意しております! ・会場限定の特別価格:オンライン価格よりもさらにお得な、イベン
さクマ

さクマ

2件の「いいね」

ありちゃん

ありちゃん

0件の「いいね」

ありちゃん

ありちゃん

0件の「いいね」

「日本は良い国」という国民神話の解体:美化された共同幻想がこの国を滅ぼす
「日本に生まれてよかった」「日本は治安が良く、四季があり、人が優しい素晴らしい国だ」――。 テレビのバラエティ番組を付ければ、外国人タレントが日本の日常的なインフラやコンビニ飯を絶賛し、SNSを見渡せば「日本独自の美徳」を誇る言葉が溢れている。私たちは物心ついた頃から、「日本は良い国である」という一種の国民神話(ナショナル・ミス)を無意識のうちに刷り込まれ、それを自明の前提として生きてきた。 しかし、断言しよう。この「日本は良い国」という言説は、もはや現状の過酷な現実から目を背けるために用意された、有害極まるアヘン(共同幻想)にすぎない。 私たちが「良い国」という実体のない
めんちかつ Mentikatu

めんちかつ Mentikatu

14件の「いいね」

割れたガラスの破片が顔や頭部を覆うように配置され、苦悩に満ちた表情で上を見上げる人物のイラスト。背景は暗い空で、心の防衛メカニズムや解離性障害による自己認識の喪失を象徴しています。
解離性障害とは|トラウマが引き起こす心の防衛メカニズムとその症状
生きづらさを抱える方の中には、過去のトラウマ体験による解離性障害や身体的自己認識の喪失に苦しんでいる方が多くいます。 解離は心の防衛メカニズムとして機能しますが、日常生活に深刻な影響を与えることがあります。 本記事では、解離の種類や症状、そして回復に向けた理解を深めていきます。 1.解離性障害の基本的理解とその種類 解離は、心の防衛メカニズムの一つであり、過去のトラウマやストレスなどから逃れるために自己を分離させる現象です。 この心理的現象は、耐え難い苦痛から心を守るための自然な反応として現れます。 ・解離性健忘の症状と特徴 解離性健忘は、特定の出来事や期間を記憶から消
無料人生相談の僧侶|サトシン

無料人生相談の僧侶|サトシン

16件の「いいね」

英語のPDF、読めないより先に閉じがち|英語PDF翻訳
英語が苦手というより、PDFを開いた瞬間にちょっと疲れることが多い。 文字は多いし、図も細かいし、読む前からなんとなく気力を使う。 しかも面倒なのは、読むことより先に整える作業。 翻訳して、コピペして、レイアウトが崩れて、結局また閉じる。 内容以前に、そこで気力がなくなること、意外と多い。 最近はPDFTranslatorにそのまま入れて、先に読める形にしてから見るようになった。 PDFのまま訳せて、しかもレイアウトもそこまで崩れないからかなり楽。 最初から読みやすい形で出てくるだけで、思ったよりかなりいい感じ。 読めないんじゃなくて、読む前に疲れてただけかもしれ
耳が遠い翔太

耳が遠い翔太

4件の「いいね」

絶望列島:餓えと闇の果てに 20XX年、夏。列島を襲ったのは、蝉しぐれの熱気ではなく、底知れぬ絶望の冷気だった。 夜明け前、政府は異例の緊急記者会見を開いた。首相の顔は土気色で、かすれた声が国民の意識を叩き起こした。「 #ホルムズ海峡 の完全封鎖により、本日より日本への原油・天然ガスの供給は完全に途絶します。」一瞬、耳を疑った。そして、続く言葉が国民を奈落の底へ突き落とした。「…不測の事態により、国家備蓄はすでに底を尽きかけております。誠に遺憾ながら、備蓄米も同様の状況です。」 テレビ画面のテロップは「 #厳重警戒 」から「 #緊急事態 」へ。そして数時間後には「 #非常事態宣言
お辞儀OJK

お辞儀OJK

14件の「いいね」

【完全版】仏像の「異形」に秘められた真実:三十二相八十種好のすべて
※この記事は2026年4月13日Geminiにより作成しました。 仏像を拝むとき、私たちは無意識にその「独特な形」を眺めています。盛り上がった頭、長く伸びた耳、指の間の膜。これらは単なるデザインではなく、「三十二相八十種好(さんじゅうにそう・はちじゅうしゅごう)」と呼ばれる、仏教における「理想の身体」の証明です。 今回は、これまでの内容をさらに深く掘り下げ、すべての特徴を文章として詳述します。 目次 1. 「超人」の証明としての身体規格 2. 三十二相が語る「救いのカタチ」 頭部:智慧の極致 四肢:あまねく広がる慈悲 足元:安定と真理の伝播 3. 仏像の細部に見
めんちかつ Mentikatu

めんちかつ Mentikatu

5件の「いいね」

もっと見る