2/18/2019

エビデンスの考え方

最近は、「科学的に証明された健康に良い食事方法」や「最新の研究によるダイエット」や「科学的に正しいトレーニング方法」などといった記事や書籍が多く見られる。

ただ科学研究の結果がそのまま実践に適用できるかどうかには多くの注意点があって、例えばマウス実験の結果をそのまま人間に当てはめて、○○は健康に悪い、○○の時間帯に食べると太る、というようなことを断言することは出来ない。こう書くとバカバカしいように思えるが、実際にそういうケースは見かける(例えばBMAL1)。個人的には、エビデンスをまともに扱えていない主張は疑似科学と紙一重だと思っている。

健康やダイエットやトレーニングについてのエビデンスを、人体の取扱説明書みたいに考えているならそれは間違いで、エビデンスはまだまだ人間には理解できない人体の複雑な仕組みを少しずつ解明するための手段であり、何らかの処置により健康の増進や体型の改善や運動パフォーマンスの向上といった、より良い結果を得るための不完全なツールにすぎない。

今回の記事では、どのようなエビデンスに信頼を置くべきなのか、エビデンスをどう使えば実践に活かすことが出来るのかを書いてみたい。なお医療におけるEBMの考え方をベースにしている。

参考サイト:根拠に基づく医療


★エビデンスのレベル
全てのエビデンスが同じ重要度で扱われるわけではなく、エビデンスにはレベルの高低がある。健康やトレーニングといった分野においては、ざっくり分けると以下のようになる。メタ解析が最もレベルの高いエビデンスで、下にいくにつれてエビデンスレベルは低くなっていく。

1. メタ解析
複数のランダム化比較試験(RCT)のデータを集めて解析した研究。メタ解析はRCTの弱点である被験者数の少なさを補うことが出来、最もエビデンスレベルの高い研究になる。解析対象とする研究の選択基準や、個別の研究の実験方法のばらつきをどうデータに反映させるかなどで、研究者のバイアスをかけることも出来るので、メタ解析研究であっても内容の吟味は必要となる。


2. ランダム化比較試験(RCT)
被験者をランダムにグループ分けし、効果を調べたい食事方法やトレーニング方法を施したグループと、そうではないグループとで効果に違いがあるかを調べる研究。要因と結果の因果関係を示しやすい。一般的に被験者数は数十人程度で、実験期間は数時間~数ヶ月程度。発生までに時間がかかる病気の研究などには向いていない。

RCT内でも強弱があり、被験者のグループ分けは適切にランダム化されているか、介入がもたらしうる効果やグループ分けは被験者や実験者に隠されて(盲検化されて)いるか、被験者の数は十分に多いか、被験者のドロップアウト・カットオフの基準は明確か、適切な統計処理がなされているかといった点がRCTの強弱を決めるポイントになる。コントロール度合いも重要で、例えばダイエットの研究なのに食事は自己管理になっているとエビデンスとしては弱くなる。


3. 観察研究
大勢の人のデータを集めて、どのような生活習慣の人がどのような病気になりやすいかを調べたり、稀な病気の個別ケースについて経過を報告したりするもの。要因と結果の相関関係を示しやすいが、因果関係を強く示せるかは研究手法による。横断研究や前向きコホート研究など色々な種類があり、調査に時間経過があるか、バイアスや交絡因子の影響の排除は十分か、といった点がエビデンスレベルを高くするポイントになる。


4. 専門家の知見
バイアスなどに左右されるが、弱いエビデンスになる。分野によってはレベルの高いエビデンスがあまりない場合があり、専門家の知見も有効に活用する必要がある。例えば審美的なボディメイクに関わるような研究は社会的に見て優先度が低いので、健康な若いトレーニング歴のある人が筋肉を増やしたり低い体脂肪率を目指すような研究は数が少ない。このような場合は、専門家の知見や経験則を上手く取り入れることで、良い結果を出せる蓋然性が高まる。


以上はすべて人間を対象とした研究で、動物実験は人体に関するエビデンスとしてはかなり弱い。

エビデンスレベルの高い研究で何度も繰り返し再現されると、それは科学的に見て確実性の高い方法であると言える。レベルの低いエビデンスが少数しかない場合や再現性が乏しい場合は、その方法は科学的に見て確実性の低いものになり、ベネフィットが大きくコストが小さいのなら試してみても良いかな・・・といった程度のものになる。研究で良い結果が一回出ただけで、それが科学的に正しいと証明されるわけではない。



★動物実験
エビデンスとして用いる場合、動物実験は無価値なのかというとそうではなくて、メカニズムを推定し、エビデンスを補強する役割を持つことは出来る。

例えば、喫煙が肺がんリスクを高めるか?という研究を行う場合、人間の被験者を対象としたRCTは、倫理面やガン発生にかかる時間の長さおよびガンの発生率を考えると実施不可能なので、観察研究でリスク度合いを算出し、人間とはシステムが多少違うが動物実験で腫瘍発生のメカニズムを推定したりするというやり方が出来る。

逆に、人間を被験者として容易にRCTを行えるような研究なのに、マウス実験ばかり繰り返してもエビデンスは弱いまま。特定の時間帯に食べると太るとか、特定の栄養素(例えば糖質)を摂取すると太るとか、そういったことを主張したいのなら、人間の被験者を実験室に数週間閉じ込めて、食事と運動を管理したRCTを行えば良い。



★一般メディアでエビデンスが利用されている場合のチェックポイント
「最新の科学研究に基づいた○○」といった記事や主張を見たら、以下のように考えると良いだろう。

・人間を対象とした研究か
動物実験(大抵はマウス・ラット)しかやっていないなら無視して良い。


・RCTか、観察研究か
質の高いRCTは考慮に値する。観察研究はレベルが一段落ちるが、観察研究でしか行えないタイプの研究もある。観察研究の中でも、既存のデータを用いて低コストで行える横断研究は、相関関係は示せるが因果関係を示す力がとても弱いので参考程度に考えておく。


・研究の期間と対象範囲
ごく短時間の変化や、身体のごく一部のメカニズムを調べた研究か、それとも長期間の身体全体の変化を調べた研究か。例えば、栄養素を摂取してから数時間の筋合成や脂肪合成を調べたような研究や、特定のホルモンが特定の栄養素の蓄積を促すといった研究は、それらの研究結果がそのまま長期間の人体の体組成変化につながるとは限らないので注意する。

短時間の研究や部分的なシステムについての研究は人体のメカニズムの推定には使えるが、身体に何らかの処置を施してより良い結果を得ようとするなら、数週間や数ヶ月といった長期間にわたって身体全体の変化を調べたRCTの結果が最も重視される。


・原則に沿っているか
トレーニングによりストレスを与えると、人体はそれに適応する。その時点の身体が慣れているレベルより少し強いストレスを与えていくと、適応がスムーズに行く(漸進的過負荷)。また与えたストレスの種類に特化した適応が起こる(特異性の原則)。

食べたカロリーはどこかに消えたりしない。○○を食べないダイエットや、○○の時間帯は食べないダイエットといった主張を見たら、カロリー収支がどうなっているのか考える。

これらの原則から外れているように見える研究結果が出たら、注意深く内容をチェックする。


・異なった研究者(研究室)の間で繰り返し再現されるか
同じ結果を示す複数の研究が見つかっても、全て同じ研究室のものということもある。出来れば違う研究室でも再現されることが望ましい。


・出資者
サプリメントについては特に、出資者がどうなっているのかチェックすると良い。サプリメーカーが出資している研究しか行われておらず、1,2回良い結果が出ただけだとエビデンスとしてはかなり弱い。またお金が絡む場合、否定的な結果の研究は表に出てきにいので、そのサプリの効果に対して否定的な結果が出ていても葬り去られ、偶然に良い結果が出た研究だけ表に出てきている可能性がある。甘味料(異性化糖 vs 砂糖 vs 人工甘味料)のようにライバルにネガティブな研究結果を出すインセンティブがある業界もあるので、背後に大きなお金が絡むかを考えると良い。


・科学界のバイアス
全ての研究者が無私無欲の科学の徒というわけではなく、研究者には自分のキャリアのために成果を出すインセンティブとバイアスがある。良い研究結果を出すためのデータの良いとこ取りを行う手法は、単なる不手際からかなり悪どいものまで様々ある。

また、科学界全体で見ると良い結果を出せた研究が表に出てきやすく、統計的に有意でないというつまらない結果で研究者のキャリアアップにつながりにくい研究は表に出てきにくいというバイアスがある。良い結果を出せた研究には偶然そういう結果が出ただけの偽陽性のものも含まれるため、実際に行われた研究全体よりも、表に出てきた研究のほうが偽陽性の割合が高くなる。極端な例を出すと、100回同じ実験をして、95回が有意差なし、5回偶然に有意差あり、という結果で、有意差なしのものは全て表に出てこず、有意差ありのものだけ表に出てきた場合、有意差ありを示す5個の研究(しかし全て偶然の結果)のみが人々の目に触れることになる。

参考サイト:When To Trust Research Findings
https://www.strongerbyscience.com/trust-research-findings/



★実践への適用
エビデンスを実践へ適用する場合は、以下のようなポイントに注意すると良いだろう。

・蓋然性
レベルの高いエビデンスが数多く揃うと、その方法は効果的である確実性が高いといえる。レベルの低いエビデンスが少数ある場合は、その方法が効果的である確実性は低いと言える。黒か白かの二択で考えるのではなく、蓋然性で考える。


・費用対効果
科学的に見て効果的である確実性が高い場合でも、その効果がどれほどのものか考える必要がある。例えば毎日飲み続けると1年間で体重が0.5kg減るお茶(1本200円)があったとする。個人的には、ダイエットのためにこのお茶を飲み続けるのは費用対効果がかなり低いと感じる。


・適用可能性
その人に適用可能か。例えば、肥満の人を対象としたダイエット研究はボディビルダーの減量の参考になるか。例えば、高価なサプリメントがもたらすわずかな運動パフォーマンス向上や減量効果は、趣味でトレーニングしている人に必要か。


・個人差
年齢、性別、肥満度、運動歴、遺伝子などにより、反応が異なる栄養素やトレーニング方法もある。属性が近い被験者を対象とした研究を参考にするのが良い。ただ同じ属性の被験者を集めた研究でも個別の被験者の結果のばらつきが大きいものもある。

例えば既存の研究だと、同じトレーニングを行っても大きく筋肥大する人もいれば逆に筋肉が少し減ってしまう人もいるし(平均では筋肥大する)、同じ量を食べすぎてもほとんど太らない人もいればしっかり脂肪がつく人もいる(平均では太る)。

研究結果が示すのはあくまで平均であり、実践に適用した場合にその人がどういう反応をするかを予測するのは困難で、反応を見ながらトレーニング内容や食事内容を調整していく必要があるだろう。遺伝子ベースのトレーニングの研究も出てきているけど、お金の匂い(遺伝子検査の販促とか)がするので、現時点では話半分で受け止めるのが良いと思う。

関連記事:トレーニング効果の個人差


・好みや目的
トレーニングでも健康でも、その人が興味を持って自主的に続けていかないと成果が出ない。好みや目的にフィットしていることが重要。ただトレーニングをするにしろダイエットをするにしろ、ひたすら楽なことをしていては効果が出ない。ある程度のストレスを与える必要があるので、その人にとって快適なやり方のほうが長続きするだろう。

ウェイトトレーニング、サーキットトレーニング、HIIT、クロスフィットなど、好みや目的にあったトレーニング方法を選ぶのが良い。ここではエビデンスは、トレーニングの効果の種類(筋力、筋肥大、筋持久力、全身持久力など)や効果の程度、それに怪我リスクを推測するのに利用できる。もちろんトレーニング歴、体力レベル、スキルレベルによって効果の程度や怪我リスクは異なる。

また同程度の効果が期待できるのなら、より楽なやり方を選んだほうが長続きするだろう。例えば、軽い重量で高レップを行う筋力トレーニングでも、重い重量でのトレーニングと同等に筋肥大することが複数の研究で示されているが、高レップトレーニングは主観的にかなり苦しいので、そういうのが好きな人や関節に不安がある人以外は普通の筋トレをするのが良いだろう。また各セットを限界レップまで追い込んでも、限界一歩手前で止めても、(特に初心者は)効果は大きく変わらないと考えられるので、ハードなのが好きな人以外は限界一歩手前で止めるのが良いだろう。

関連記事:各セット限界まで追い込むべきか


・人体の反応と人間の性向
生理学的に人間の身体がどう反応するかと、実際の生活において人間がどういう行動を取りやすく、どういう結果になりやすいかは異なる。例えば、運動によって消費カロリーを増やしても、食事を減らすことで摂取カロリーを減らしても、カロリー収支への寄与の点では同じであり、アスリート並の体力があるのでなければ運動で大きなカロリーを消費するのは困難なので、理屈の上ではカロリー収支を改善したいのなら食事を減らすのが効率が良いことになる。しかし運動量が少ないと食欲のコントロールが難しくなり、ついつい食べすぎてしまうことが研究で示されているので、カロリー収支を改善したいのなら適度な運動を行ったほうが良い結果を得やすいと考えられる。

関連記事:運動と食欲



参考サイト:

The Levels of Evidence and their role in Evidence-Based Medicine
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3124652/

Levels of Evidence
https://www.essentialevidenceplus.com/product/ebm_loe.cfm?show=oxford

Evidence-based practice in Exercise and Nutrition: Common Misconceptions and Criticisms
https://www.lookgreatnaked.com/blog/evidence-based-practice-in-exercise-and-nutrition-common-misconceptions-and-criticisms/