以前より、ポスト持ってる研究者でもロクにSDとSEの使い分けを理解していない事実に苛だっていたので、少しでも後進者が理不尽な要求を受けた際の助けになればと思い、記します。

※ご留意ください:
 当ブログのコンセプトから少し外れますが、全くの初学者向けというよりも、研究を始めた大学の学部3回生くらいをターゲットとした言葉選びをしています。
1.SDとSEの定義
 そもそもSD(標準偏差)とSE(標準誤差)とは何か。
 定義については各種の統計解説サイト等でも扱われていますので、触れる程度に記します。


Ⅰ. SD(標準偏差):
 個々のデータのバラつきの指標。
 それぞれのデータが平均からどれだけ乖離しているのかによって定義される。
 非常に分かりやすい指標です。画一的であるため、基本的に、どのようなデータに使っても間違っているということはありませんが、生物系の研究においては後述。


Ⅱ. SE(標準誤差):
 データの「平均値」のバラつきの指標
  (厳密にいえばこの定義は”SEM:平均標準誤差”を指したものです。ただし、平均以外の指標においてSEを用いることは稀だと思いますので、基本的にはこの定義で問題ないかと)。
 端的に言えば、限られた試料数で求めた平均値から、世界中の全試料を分析した際の平均値がどの程度になるのかを表したものです。(一般的に、前者を「標本」、後者を「母集団」と呼称します)
 こちらも詳細は後述。



2.生物系におけるSDとSEの取り扱い
Ⅰ. SD(標準偏差):
 一般的に、生物系においてSDは細胞実験の結果等に用いられます。
 これには2つの意義があります。

1)細胞実験によって得られるデータは、「1well当たり数万以上の細胞の平均値」の平均値となっていること
2)細胞実験においては、それぞれの細胞のバックグラウンド(遺伝子等)が同一のものであるという前提があること

 これらの前提より、細胞実験によって得られる結果はいついかなる時であっても同種の細胞を用いている場合は同一の結果を得られることが担保されます。
 そのため、手技や些細な環境の違いに起因するバラツキはシンプルな指標であるSDによって示されることが多くなっています。


Ⅱ. SE(標準誤差):
 一般的に、生物系においてSEは動物実験の結果等に用いられます。
 これには次の意義があります。

1)実験動物において、その結果は数匹(あるいは数十匹かもしれませんが)の「個体の平均値」に過ぎないこと
2)動物は、それぞれの個体によってバックグラウンドが異なっていること

 以上より、標本のバックグラウンドの分布が必ずしも母集団のバックグラウンドの分布とは一致しないという点において、母集団の平均を示すためにSEが用いられていることが多いです。(単純にデータのバラツキが大きいからではなく)
 端的に言えば、実験動物の個性を加味すると、今日購入した10匹のマウスと明日購入する10匹のマウスでは個性の分布にも差異があることが想定されるため、「マウス全体の真の平均値」と「実験によって得られた平均値」が一致する可能性は低くなります。そうした中で、『個性の偏りがどのような形であっても、「マウス全体の真の平均値」はこれくらいの範囲に収まるだろう』と推測した範囲が平均±SEで表されるものです。



3.所感
 生物系研究者では、画一的に「細胞ならSD、動物ならSEでエラーバーをつける」と考えている方も多くいるように感じます。
 しかし、それぞれが表すものが全く異なる以上、これはもう少し立ち止まって考えるべき問題です。
 個人的な所感としては、データをデータとして取り扱うのであれば、全てをSDで示してもいいくらいだと感じますし、仮にSEを採用するとしても、SDを併記する方が誠実だと考えます。
 仮に、動物実験の結果をSDで示しても、「明記されている実験系と標本数に基づくバラつき」を示しているという点において合理性はあります。まあ、それでは見栄えが悪いから、「SEを使うことが非合理でない場合はSEを使う」というのも理解はできますが。

 また、「SEを用いるのが非合理ではない場合」についても考える必要があります。
 上では「一般的に細胞実験の場合はSDを用いる」と記しました。しかし、単細胞解析の場合などはどうでしょうか?
 解析した細胞の遺伝子的なバックグラウンドは全て同一だとしましょう。しかし、解析しているデータは「数万の細胞の平均値」ではなく「一つ一つの細胞のデータ」です。
 それぞれの細胞が位置する場所も異なり、それに起因する温度や試薬濃度の不均一さも結果に影響しているかもしれません。
 こうした場合、SEを用いることは非合理でしょうか?
 「遺伝子的に同一であれば、データのバラつきは手技に起因するものだろうからSEは不適切だ」という考えもあるでしょうし、「解析した細胞は播種した細胞全てではないため、母集団から標本を抽出している。そのため、母集団と標本の分布が一致するとは限らず、SEを用いることは合理的だ」という考えもあるでしょう。
 結局、こうしたシチュエーションにおいては研究者自身がどういったスタンスであるのかが重要となります。
 各所で言われていることですが、SEやSDに限らず、検定をはじめとする統計的処置をデータに施す際には、実験計画の時点で自身のスタンスを明確にしておくことが肝要です。


研究を始めたばかりの学生さんへ:
 どうせあなたの指導教官や上役もロクにデータ処理を知っている訳ではないのですから、毅然とした態度で自身の合理性を主張してください。
 多分、統計について少しでも調べようと思った皆さんの方が知識は上です。
 また、主張する際には、「一般的には~~だが、このデータは××なので○○です」といった主張がいいでしょう。
 あなたの指導教官は一般的な話しか知らず、またその「一般的な話」も表面的にしか理解していません。




P.S.
 私の知識も聞きかじりや自己解釈が含まれますので、間違っている点等ありましたらコメントでご指摘ください。