対応 の ない t 検定。 t検定(対応のないt検定)

t検定(対応のないt検定)

対応 の ない t 検定

F検定(等分散かどうかの検定) このページでは、F検定について解説します。 F検定は2群の差の検定を行う前の、2群の母集団が等分散であるどうかを判定する検定です。 (F検定を行う必要があるかどうかは、こちらのを参考にしてみてください。 ) 母集団が等分散かどうかとは、母集団の分散が等しいかどうかと意味です。 2群のデータの分布をグラフにした場合、形が似ているかどうかに対応するとも言えるでしょう。 にて解説しています)。 不偏分散の比から母集団の分散の比(つまり分散が等しいかどうか)を検討する手法がF検定です (等分散であるほど比が1に近づきます)。 に沿って、検定を行います。 ある標本データの不偏分散の比のF値が5となったとします。 そして、を算出します(F分布表を見て頂いてもOKです)。 例えば、自由度が分子:3、分母:7であるとすると、4. 35という値が限界値です。 35に対して、実際の算出値が5となったため、帰無仮説は棄却され、 2群の母集団に差はある ことになります。 また、t検定だけでなくを行う場合でも等分散かどうかを確認しておかなければいけない方法も多々ありますので、F検定についてきちんと理解しましょう。 関連記事 ExcelでF検定を行ってみよう! Excelデータ分析ツールを用いて、下記データで2群の差の検定(t検定)の前のF検定を行ってみましょう。 ある学校のクラスAとクラスBの体重のデータを得たとします。 05は有意水準を表します。 ・出力オプション:出力したい場所を選択しましょう。 今回は新規のワークシートに出力しています。 すると以下のような結果が出力されます。 結果を判定してみよう! 結果の判定はいくつかの方法で行えます。 (により上側確率0. 05,分子の自由度9,分母の自由度9から一致していることを確認してみましょう) ・実際のF値(不偏分散の比)は結果の観測された分散比として出力されます。 今回は9. となります。 ・よって、9. 61>3. 18となるので、帰無仮説は棄却、2つの母集団は等分散でないという判断になります。 ・とてもシンプルな判定です。 P値0. 001211<0. 05であり、今回の結果は棄却域に入っている、つまり帰無仮説が棄却され、2つの母集団は等分散でないという判断ができます。 しかし、クラスAとBのデータを列を逆にして、変数1,2の入力範囲を指定すると下記のような結果が出力されます。 よって、上記のようなデータになりましたら、変数1の分散が大きくなるよう入れ替えたり、調整しましょう。 これはExcelが分子、分母の大きさも考量した判定を行ってくれているためです。 等分散でないという判定が出たため、さらに2群の差を検定したい場合は、を行っていきます。 関連記事 ExcelでF検定を行ってみよう(その2)! 上の例では、等分散でない結果が出ましたので、等分散となる時のデータ例、結果例も載せてみます。 F検定の手順は上の例の通りです。 ある学校のクラスCとクラスDの体重のデータを得たとします。 ・実際のF値(不偏分散の比)は結果の観測された分散比として出力されます。 今回は1. 2群の不偏分散がかなり近い値であると言えます。 ・よって、1. 18となるので、帰無仮説は受容、2つの母集団は等分散であるという判断になります。 359... 関連記事.

次の

Student

対応 の ない t 検定

ある2郡間の平均値において、統計的に有意な差があるかどうか検定したいです。 ちなみに、対応のない2郡間での検定です。 T検定を行うには、ある程度のサンプル数(20以上程度?)があった方が良く、サンプル数が少ない場合には、Mann-WhitneyのU検定を行うのが良いと聞いたのですが、それは正しいのでしょうか? また、それが正しい場合には実際にどの程度のサンプル数しかない時にはMann-WhitneyのU検定を行った方がよろしいのでしょうか? 例えば、サンプル数が10未満の場合はどうしたらよろしいのでしょうか? また、T検定を使用するためには、正規分布に従っている必要があるとのことですが、毎回正規分布に従っているか検定する必要があるということでしょうか?その場合には、コルモゴルフ・スミノルフ検定というものでよろしいのでしょうか? それから、ノンパラメトリックな方法として、Wilcoxonの符号化順位検定というものもあると思いますが、これも使う候補に入るのでしょうか。 統計についてかなり無知です、よろしくお願いします。 結局ですね、適切な検定というのは適切なp値が得られるということなんですよ。 適切なp値というのは第1種の過誤と第2種の過誤をなるべく低くするようにする方法を選ぶということなのですね。 従来どおりの教科書には「事前検定をし、正規性と等分散性を仮定できたら、、、」と書いていありますが、そもそも事前検定をする必要はないというのが例のページの話なのです。 どちらが正しいかというと、どちらも正しいのです。 だから、ある研究者はマンホイットニーのU検定を行うべきだというかもしれませんし、私のようにいかなる場合においてもウェルチの検定を行う方がよいという者もいるということです。 ややこしく感じるかもしれませんが、もっと参考書を色々と読んで分析をしていくうちにこういった内容もしっくり来るようになると思います。 あくまでも「仮定」できればよいのであって、その仮定が妥当なものであれば問題ないのです。 要するにいかなる場合においても「等分散性を仮定しないt検定」を行うと良いということです。 事前検定を行うことが、すでに検定の多重性にひっかかると考える人もいます(私もその立場にいます)。 それは「歪みのある分布」と「一様な分布」のシミュレーショングラフを見れば分かりますね。 ご回答ありがとうございます。 サンプル数ではなく、サンプルサイズなのですね。 参考記事を読ませていただきました。 これによると、2群のサンプルサイズがたとえ異なっていても、 またサンプルサイズが小さくても、それから等分散に関わらず、 基本的に等分散を仮定しない t 検定を採用するのが望ましいという ことになるのでしょうか? つまり、正規分布に従っている場合、サンプルサイズが小さくても基本的に等分散を仮定しない t 検定を採用し、正規分布に従わない場合に、ノンパラメトリックな方法であるマン・ホイットニーの U 検定などを採用すればよろしいということでしょうか? また、マン・ホイットニーの U 検定は等分散である場合にしか使えないということだと理解したのですが、もし正規分布に従わず、等分散でもない場合には、どのような検定方法を採用することになるのでしょうか? いろいろご質問してしまい申し訳ございませんが、 何卒よろしくお願いします。 理想は、全てのサンプルのデータを得ること。 これは、必ず差がでます。 1mmでも、1mgで大きいほうが、誰がやっても大きいのです。 t検定は、「例数が少なくても」というのが特長です。 有意差は、有れば「有意差が有る」と書け、説得力が少しは増すだけです。 信頼性については、「いつくのサンプルなら絶対」というのは、ありません。 経験的なもので、特にヒトの場合はいろいろな人がいるので、サンプル数が十分に大きくないと、なんぞが書かれていますが、どれだけなら十分かは客観的に、というのはありません。 あくまでも確率です。 実際、食品とガンとの関係で、味噌汁は、ガンになりにくい、なりやすい、なりにくい、と二転三転しています。 実際には、無作為抽出を無限解すれば、正規分布をする、というのが統計学の基礎です 教科書だと、はじめの部分に記述してある。 そうでないと、t検定根拠を失います。 例外的に、無作為抽出をしても、「人の平均貯蓄額は、正規分布をしない」というのは有名です。 私は動物実験をして、各群3匹、計6匹で有意差有との論文にクレームがついたことはありません。 動物の場合は、無作為抽出と想定されますが、ヒトの場合は困難です。 正規分布の判定は、正規確率紙の方法は見たことがありますが、知りません。 10と1でも、2. 3と1でも、順位はいずれも1番と2番です。 10と1の方が差が大きいという情報は利用されていません。 ですから、t検定よりも有意差はでにくいでしょう。 しかしサンプル数が大きければt検定と同程度の検出力がある、と読んだことがあります。 正規分布していることが主張できないのなら、U検定は有力な方法です。 有意差が出やすい方法を選ぶのは、研究者の能力です。 ただ、正規分布していないのにt検定は、ルール違反です。 6 7. 225 4. 9 2. 6+7. 225+4. 9+2. 025=49. 25 計算過程をさらりと書いていますが,早い話が観測値と理論値のズレの大きさはいくらになるのか,を求めることになります.最終的には「49. 25」というズレ値が算出されました. さて,この「49. A ベストアンサー pは確率 probability のpです。 全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。 統計・確率には100%言い切れることはまずありません。 例えばサイコロを5回振って全て同じ目が出る確率は0. そんな時、そのサイコロを不良品 イカサマ? と結論つけるとわずかに間違っている可能性が残っています。 05でそのサイコロは正常ではないと結論付けます。 それが危険率です。 05で相関がない 相関がないと結論。 エクセルでの計算ですが、まず関数CORRELを使ってr値を出します。 5 ここでnは組みデータの数です。 ( x1,y1 , x2,y2 ,・・・ xn,yn ) 最後に関数TDISTで確率に変換します。 両側です。 (アドインの分析ツールを使う以外は pは確率 probability のpです。 全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。 統計・確率には100%言い切れることはまずありません。 例えばサイコロを5回振って全て同じ目が出る確率は0. そんな時、そのサイコロを不良品 イカサマ? と結論つけるとわずかに間違っている可能性が残っています。 05でそのサイコロは正常ではないと結論付けます。 それが危険率です。 この場... 05以下 であれば、正規分布ではないと結論づけてお終いでいいのではないですか。 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。 ヒストグラムを作成する場合、区間距離、度数区分数は、正規的なグラフになるように試行錯誤で行うことが多い 区間距離や度数区分数を本来の分布に則するようにいろいろ当てはめて解釈する。 区間がと度数区分数が出たら、その範囲にあるデータ数を数えて、ヒストグラムができます。 ヒストグラム作成の処理に関しては、上記を参考にしてください。 その前に、データの最小値と最大値が、正しくとれたデータか検討するため、棄却検定で外れ値が存在するか否かを検定し、外れ値が存在しないと結論づけられたら、正規分布の検定を行ってみてください。 もし外れ値が存在する可能性があれば、そもそも、そのデータの信頼性が失われます。 サンプリング手法の再検討 データの取り方に偏りがなかったか、無作為に設定してデータを取っていたか等 をして、再度データを得る必要があります。 また、そもそも検定する以前に、データ数が少ないと判断が付かなくなってしまいますので、データ数は十分揃える 少なくとも20~30個 必要もあります。 05以下 であれば、正規分布ではないと結論づけてお終いでいいのではないですか。 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。 ヒストグラムを作成する場合、区... 平均ではないように見えても、検定の計算式の中に、2群の平均値を用いています。 ただ、前提時要件があって、2群が正規分布していることが必要です。 サンプルを選んだときに、無作為抽出していたり、サンプル数が1000ほどあれば、正規分布を想定できます。 検定法は、どの方法を選ぶかは、研究者の自由です。 わたしがt検定を多用するのは、正規分布を想定でき、計算式が分かりやすく、サンプル数が2群で異なっても良い、その数も少なくて良い 大差があるので、1群3例でも有意差をだしています 、そして有意差が出やすいからです。 この場合は、正規分布しているという条件を満たしているとはいえないだろうと判断します。 その場合は、F検定をしてください。 これは、2群の平均値ではなく、バラツキによって検定する方法です。 正規分布している必要は無いとされています。 F検定で有意差があれば、問題ありません。 t検定では有、F検定ではなし、になると方針が定まりませんが 現在このデータで悩んでいます。 その人に訊くのが一番です。 身近にいないのなら、いないと返答があれば、書き込みますが。 というのも、大学などの研究テーマだと、指導教員をさしおいて、はマズイノデ。 もしも、このテーマに興味を持てば、私が実施して先に発表します。 こんな研究内容がハッキリ分かる書き込みを4年生がやったら、研究室は追放ですね。 長男、次男だけではなく、三男、四男となると多重比較という方法になります。 この場合、H検定 エクセルだけでは無理でしょう を使います。 平均ではないように見えても、検定の計算式の中に、2群の平均値を用いています。 ただ、前提時要件があって、2群が正規分布していることが必要です。 サンプルを選んだときに、無作為抽出していたり、サンプル数が1000ほどあれば、正規分布を想定できます。 検定法は、どの方法を選ぶかは、研究者の自由です。 わたしがt検定を多用するのは、正規分布を想... Q エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。 両者の違いが良くわかりません。 宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。 (例) セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3. 89444、STDEVPでは3. 741657となります。 また、平均値7と各数字の差を取り、それを2乗し、総和を取る 182 、これをデータの個数13で割る 14 、この平方根を取ると3. 741657となります。 では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。 A ベストアンサー データが母集団そのものからとったか、標本データかで違います。 また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。 で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。 公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。 まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。 AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。 また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要なサンプル数は、比べる検定手法により計算できるものもあります。 最低限必要なサンプル数ということでは、例えば、ある集団から、ある条件で抽出したサンプルと、条件付けをしないで抽出したサンプル 比べるための基準となるサンプル を比較するときに、そのサンプルの分布が正規分布 正規分布解説:身長を5cmきざみでグループ分けし、低いグループから順に並べたときに、日本人男子の身長なら170cm前後のグループの人数が最も多く、それよりも高い人のグループと低い人のグループの人数は、170cmのグループから離れるほど人数が減ってくるような集団の分布様式 でない分布形態で、しかし分布の形は双方とも同じような場合「Wilcoxon符号順位検定」という検定手法で検定することができますが、この検定手法は、サンプルデータに同じ値を含まずに最低6つのサンプル数が必要になります。 それ以下では、いくらデータに差があるように見えても検定で差を検出できません。 また、統計上差を出すのに必要なサンプル数の例では、A国とB国のそれぞれの成人男子の身長サンプルがともに正規分布、または正規分布と仮定した場合に「t検定」という検定手法で検定することができますが、このときにはその分布を差がないのにあると間違える確率と、差があるのにないと間違える確率の許容値を自分で決めた上で、そのサンプルの分布の値のばらつき具合から、計算して求めることができます。 ただし、その計算は、現実に集めたそれぞれのサンプル間で生じた平均値の差や分布のばらつき具合 分散値 、どのくらいの程度で判定を間違える可能性がどこまで許されるかなどの条件から、サンプル間で差があると認められるために必要なサンプル数ですから、まったく同じデータを集めた場合でない限り、計算上算出された 差を出すために 必要なサンプル数だけサンプルデータを集めれば、差があると判定されます すなわち、サンプルを無制限に集めることができれば、だいたい差が出るという判定となる。 よって、集めるサンプルの種類により、計算上出された 差を出すために 必要なサンプル数が現実的に妥当なものか、そうでないのかを、最終的には人間が判断することになります。 具体的に例示してみましょう。 ある集団からランダムに集めたデータが15,12,18,12,22,13,21,12,17,15,19、もう一方のデータが22,21,25,24,24,18,18,26,21,27,25としましょう。 一見すると後者のほうが値が大きく、前者と差があるように見えます。 そこで、差を検定するために、t検定を行います。 常識的に考えても、これだけのサンプル数で差があると計算されたのだから、差があると判断しても差し支えないだろうと判断できます。 ちなみにこの場合の差が出るための必要サンプル数は、有意確率5%、検出力0. 8とした場合に5. 7299、つまりそれぞれの集団で6つ以上サンプルを集めれば、差を出せるのです。 一方、サンプルが、15,12,18,12,21,20,21,25,24,19の集団と、22,21125,24,24,15,12,18,12,22の集団ではどうでしょう。 この場合に、このサンプルの分布様式で拾い出して差を出すために必要なサンプル数は551. 33となり、552個もサンプルを抽出しないと差が出ないことになります。 この計算上の必要サンプル数がこのくらい調査しないといけないものならば、必要サンプル数以上のサンプルを集めて調べなければなりませんし、これだけの数を集める必要がない、もしくは集めることが困難な場合は差があるとはいえないという判断をすることになるかと思います。 一方、支持率調査や視聴率調査などの場合、比べるべき基準の対象がありません。 その場合は、サンプル数が少ないレベルで予備調査を行い、さらにもう少しサンプル数を増やして予備調査を行いを何回か繰り返し、それぞれの調査でサンプルの分布形やその他検討するべき指数を計算し、これ以上集計をとってもデータのばらつきや変化が許容範囲 小数点何桁レベルの誤差 に納まるようなサンプル数を算出していると考えます。 テレビ視聴率調査は関東では300件のサンプル数程度と聞いていますが、調査会社ではサンプルのとり方がなるべく関東在住の家庭構成と年齢層、性別などの割合が同じになるように、また、サンプルをとる地域の人口分布が同じ割合になるようにサンプル抽出条件を整えた上で、ランダムに抽出しているため、数千万人いる関東の本当の視聴率を割合反映して出しているそうです。 これはすでに必要サンプル数の割り出し方がノウハウとして知られていますが、未知の調査項目では必要サンプル数を導き出すためには試行錯誤で適切と判断できる数をひたすら調査するしかないかと思います。 多少の大きさのばらつきが生じてしまいます。 1mm違っても規格外品となります。 工場では企画外品をなるべく出さないように、統計を取って、ネジの直径のばらつき具合を調べ、製造工程をチェックして、不良品の出る確率を下げようとします。 しかし、製品をすべて調べるわけにはいきません。 そこで、調べるのに最低限必要なサンプル数を調査と計算を重ねてチェックしていきます。 一方、農場で生産されたネギの直径は、1mmくらいの差ならほぼ同じロットとして扱われます。 また、農産物は年や品種の違いにより生育に差が出やすく、そもそも規格はネジに比べて相当ばらつき具合の許容範囲が広くなっています。 ネジに対してネギのような検査を行っていたのでは信頼性が損なわれます。 そもそも、統計学的検定は客観的判断基準の一指針ではあっても絶対的な評価になりません。 あくまでも最終的に判断するのは人間であって、それも、サンプルの質や検証する精度によって、必要サンプルは変わるのです。 あと、お礼の欄にあった専門家:統計学者とありましたが、統計学者が指摘できるのはあくまでもそのサンプルに対して適切な検定を使って正しい計算を行ったかだけで、たとえ適切な検定手法で導き出された結果であっても、それが妥当か否か判断することは難しいと思います。 そのサンプルが、何を示し、何を解き明かし、何に利用されるかで信頼度は変化するからです。 ただ、経験則上指標的なものはあります。 正規分布を示すサンプルなら、20~30のサンプル数があれば検定上差し支えない それ以下でも問題ない場合もある とか、正規分布でないサンプルは最低6~8のサンプル数が必要とか、厳密さを要求される調査であれば50くらいのサンプル数が必要であろうとかです。 でも、あくまでも指標です。 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。 また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要な... Q 統計についてはまったくの初心者で意味がわかりません。 こちらで回答されているのを見ていたのですが、よくわからないので質問させていただきました。 論文を提出するのに、Mann-Whitneyの検定を用いるのは上司より指導いただき わかったのですが、ソフトで出た語句について説明できません。 000 論文提出の期限が迫っており大変困ってます。 すみませんが、回答宜しくお願いします。 Q ご覧頂きありがとうございます。 有意差検定についての質問です。 正規分布していない二つの群について有意差検定を行う必要がありMann-Whitney検定を使っています。 way-nifty. html というご意見を頂いています。 分散を比較すべきでしょうか。 比較すべきであればどういった方法で行い、等しくない場合にはどの検定が使えるのでしょうか。 また、もうひとつ、今回2群のサンプル数が8倍くらい違います。 90と700というような状況です。 これについてはMann-Whitney検定を行うことに問題はないのでしょうか。 統計は今までほとんど使ってこなかったため付け焼刃の知識で解析しており間違った検定をしていないか心配です。 ご回答よろしくお願いします。 A ベストアンサー たびたび申し訳ありません。 Ansari-Bradely検定の記述をもう一度確認してみましたが,今回の場合では不適切ですね。 Ansari-Bradely検定は,代表値が(ほぼ)等しい時に,散布度(分散)に違いがあるかどうかを調べる検定法です。 今回のように,代表値に違いがあるかどうかを調べる場合には,この方法は不適切ですね。 A ベストアンサー 分析ツールが有効になっていないためです。 次の方法でアドインを読み込みましょう。 読み込みが完了しExcelを再起動すると「データ」タブ内に「分析」の項目ができて「データ分析ボタン」が表示され使用可となります。 Excel ヘルプで検索。 [データ分析] コマンドが表示されない場合は、分析ツール アドイン プログラムを読み込む必要があります。 [ファイル] タブをクリックし、[オプション] をクリックして、[アドイン] カテゴリをクリックします。 [管理] ボックスの一覧の [Excel アドイン] をクリックし、[設定] をクリックします。 [有効なアドイン] の一覧の [分析ツール] チェック ボックスをオンにし、[OK] をクリックします。 ヒント [有効なアドイン] の一覧に [分析ツール] が表示されない場合は、[参照] をクリックしてアドイン ファイルを検索します。 分析ツールが現在コンピューターにインストールされていないというメッセージが表示されたら、[はい] をクリックして分析ツールをインストールします。 分析ツールが有効になっていないためです。 次の方法でアドインを読み込みましょう。 読み込みが完了しExcelを再起動すると「データ」タブ内に「分析」の項目ができて「データ分析ボタン」が表示され使用可となります。 Excel ヘルプで検索。 [データ分析] コマンドが表示されない場合は、分析ツール アドイン プログラムを読み込む必要があります。 [ファイル] タブをクリックし、[オプション] をクリックして、[アドイン] カテゴリをクリックします。 [管理] ボックスの一覧の [Excel アドイン] をクリッ...

次の

T検定とMann

対応 の ない t 検定

Contents• T検定とは何?具体例でわかりやすく解説! 「世の中にはいろんな検定があるけど、それぞれがどんな検定なのかが分かりません・・・。 」 私のところに、そのような質問が多々寄せられます。 確かに統計の検定は数が多くて、結局何をやっているのかが分かりにくかったりします。 そんな時のアドバイス。 どんな検定をしているかを手っ取り早く、そして正確に把握するにはあるものを見ればいいんです。 それは、 「帰無仮説と対立仮説」です。 帰無仮説と対立仮説は、「何を検定しているのかを直接文章として記載しているもの」です。 そのため、その検定が何をやっているか、帰無仮説と対立仮説を確認することで一目瞭然なのです。 ということで、本サイトの検定に関する記事では、必ず帰無仮説と対立仮説を載せるようにしますね。 T検定の帰無仮説と対立仮説 では早速、T検定の帰無仮説と対立仮説は何かを見てみましょう。 T検定は有名なので、仮説を見なくても「平均値に対する検定だ」とわかるかもしれません。 ですが、これから勉強をするにつれ、初めてその名前を聞く検定が、今後出てくると思います。 その時には、帰無仮説と対立仮説を確認するようにしましょう。 T検定を実施する具体例 T検定は平均値を検定する統計的手法だということがわかりました。 であれば、具体的にどんな時にT検定を実施できるでしょうか? 平均値を使うということは、データが「」と「」の2点が重要です。 そのため、以下のような場合にはT検定が使えますね。 新薬群とプラセボ群の患者さんの身長の違いを知りたい• A大学とB大学の学生の体重の違いを知りたい T検定にはたくさん種類がある?1標本や2標本、対応ありや対応なしとは? T検定と検索すると、1標本のT検定とか2標本のT検定とか、2種類出てきますよね。 それらの違いって何?って疑問に思ったことないでしょうか。 私も統計を勉強し始めた頃、全然イメージができませんでした。 でも実は、それほど難しい概念ではないです。 一言でいうと、 データが1種類か2種類かの違いです。 例えば。 ある時点の、A群だけの身長データ。 これは1標本。 ある時点の、A群とB群の身長データ• これは2標本。 ある時点(時点1)の、A群だけのデータと、その1年後(時点2)の、A群だけの身長データ• これも2標本。 ですが、対応のある2標本と言われています。 で、この1標本と2標本で、T検定のやり方は何か違いがあるの?と思いますよね。 実は、ほぼ一緒です! なぜかを考えるのに、それぞれの帰無仮説を確認してみましょう。 A群の身長の母平均=0• A群の身長の母平均=B群の身長の母平均• A群の時点1の母平均=A群の時点2の母平均 で、2と3については、右辺を左辺に持っていく。 すると、結局こうなります。 A群の身長の母平均=0• A群の身長の母平均- B群の身長の母平均=0• A群の時点1の母平均- A群の時点2の母平均=0 引き算があるかどうかの違いだけで、3つともほぼ一緒じゃないですか? なので、 1標本とか2標本とかによって何かしら新しく考えることがあるわけではなく、結局は同じことを検定しています。 等分散性とは文字通り、 A群とB群のデータの分散が同じである性質、ということ。 これがあるために一昔前は、以下のフローでT検定を実施されることが多くありました。 Twitterでも悩んでいる方がいましたね。 研究の話 結局F検定やって等分散か調べた後にt検定の種類選ぶのがよいのか最初からウェルチやった方がよいのか — サカユリヤはミジンコストラップ作る人 sakayuriya つまり、このような方法をやる必要があるか? ということです。 私も大学院時代にマイクロアレイ解析をしていた時は、この方法を使っていました。 ですが、 今ではこのような方法はほとんど見られません。 理由は大きく2つ。 データ依存で検定が変わるため、本来の検定の手順としてはよろしくない。 (本来は母集団の分散がどうかなので、データに依存しない方法で検定は決まるべき)• WelchのT検定は等分散でなくても使って良い。 ということで、WelchのT検定さえ使っておけば、誰も文句言わないです。 T検定における自由度の考え方とは? T検定を実施するのに必要なもう一つの知識。 それが自由度です。 なのでここでは、T検定に特化した自由度の考え方だけお伝えします。 結論から言うと、T検定の自由度は 「データの数ー群の数」です。 例えば、2群のデータで、各群10個のデータ。 計20個のデータがあったとします。 SPSSやEZRでT検定を実践する! SPSSやEZRでt検定を実践する方法をまとめています。 SPSSは言わずと知れた、統計解析ソフトです。 IBM社から発売されています。 >> EZRとは無料の統計ソフトであるRを、SPSSやJMPなどのようにマウス操作だけで解析を行うことができるソフトです。 EZRはRと同様に完全に無料であるため、統計解析を実施する誰もが実践できるソフトになっています。 2019年5月の時点で英文論文での引用回数が2400回を超えているとのことで、論文投稿するための解析ソフトとしても申し分ありません。 >> T検定に関するまとめ• その検定が何をやっているかは、帰無仮説と対立仮説を見ればわかる。 T検定は、平均値の違いを検定する方法。 1標本とか2標本とかあるけど、本質は一緒。 WelchのT検定さえ使っておけば、間違いはない。

次の