第2章 心理学的研究

図2.1 | テレビの番組は子供の行動にどのような影響を与えるでしょうか?(credit: modification of work by “antisocialtory”/Flickr)

この章の概要

2.1 なぜ研究が重要なのでしょうか?
2.2 研究へのアプローチ
2.3 成果の分析
2.4 倫理

はじめに

あなたは、自分がテレビで見る暴力が自分の行動に影響を与えているのではないかと思ったことはありませんか?画面上の劇的な状況で暴力的に振る舞う人々を見た後では、現実の生活の中で攻撃的に振る舞う可能性が高くなるのでしょうか?それとも、架空の暴力を見ることで、実際にはあなたの中から攻撃性が取り去られ、あなたのことをより平和的にするのでしょうか?子供たちは、彼らがさらされるメディアによってどのような影響を受けるのでしょうか?行動と暴力的なイメージへの曝露との関係性に興味を持っている心理学者は、まさにこのような質問をするかもしれません。

古代から人類は、新しいテクノロジーが私たちの行動や思考プロセスに与える影響について懸念してきました。たとえば、ギリシャの哲学者ソクラテスは、当時の新しい技術であった「書く」という行為が、人々の記憶力を低下させるのではないかと心配していました。なぜなら、彼らは情報を記憶することに力を注ぐ代わりに、書かれた記録に頼ることにするかもしれないからです。私たちの急速に変化するテクノロジーの世界では、テクノロジーが私たちの日常生活に与える影響と、その結果として生じる長期的な影響についての疑問が絶えず浮かんできています。画面を見ている時間(スマートフォン、タブレット、コンピュータ、ゲーム)の影響に加えて、乗り物(GPSやスマートカーなど)や住宅(AlexaやGoogle Home、玄関のカメラなどのデバイス)にもテクノロジーが登場しています。これらのテクノロジーが私たちの生活に溶け込むにつれ、私たちはその肯定的な影響と否定的な影響についての疑問に直面するようになります。私たちの多くは、これらの問題に関して強い意見を持っていますが、隣の人が正反対の意見を持っていることにも気づいています。

単なる意見によってではなく、誰もが納得することのできる証拠によって裏付けられた答えを見つけるにはどうしたらよいのでしょうか?心理学研究の成果は、私たちがこのような問題を切り抜けていくのに役立ちます。

2.1 なぜ研究が重要なのでしょうか?

学習目標

この節が終わるまでに、あなたは次のことができるようになります:

  • 科学的研究が行動についての質問にどのように対処しているかを説明する
  • 科学的研究がどのように公共政策を導いているかを議論する
  • 科学的研究が個人的な意思決定をする上でいかに重要であり得るかを理解する

科学的研究は、私たちの複雑な世界をうまく舵取りしていくための重要な道具です。それがなければ、私たちは直感、他人の権威、そして盲目的な運だけに頼らざるを得ないでしょう。私たちの多くは、周りの世界を読み解き、それらと相互作用するという自分の能力に自信を持っていますが、歴史の中には、主張を支持するための証拠の必要性を認識していないときに、私たちがいかに大きな間違いを犯すかを示す例がたくさんあります。歴史上のさまざまな時期において、私たちは、太陽が平らな地球の周りを回っていること、地球上の大陸は動かないこと、精神的な病気は憑依によって引き起こされることを確信していました(図2.2)。体系的な科学的研究によって、私たちは先入観や迷信から抜け出し、自分自身と自分の世界を客観的に理解することができるのです。

図2.2 | 私たちの祖先の一部の人々は、世界各地で、そして何世紀にもわたって、穿孔(ここに示されるように、頭蓋骨に穴をあける慣行)によって、悪霊を体外に追い出し、精神的な病気やその他の障害を治すことができると信じていました。(credit: “taiproject”/Flickr)

すべての科学者の目標は、自分を取り巻く世界をよりよく理解することです。心理学者は、行動を理解すること、そして行動の根底にある認知的な(心の)プロセスと生理学的な(身体の)プロセスを理解することに焦点を当てています。直感や個人的な経験などといった、人が他人の行動を理解するために使う他の方法とは対照的に、科学的研究の特徴は、主張を裏付ける証拠があることです。科学的知識は経験主義的なものです:それは、誰が観察しているかにかかわらず、何度も何度も観察することのできる客観的で具体的な証拠に基づいています。

行動は観察可能ですが、心は観察できません。もし誰かが泣いているならば、私たちは行動を見ることができます。しかしながら、その行動の理由を判断するのはもっと難しいです。その人が泣いているのは、悲しいからなのでしょうか、苦しいからなのでしょうか、それとも嬉しいからなのでしょうか?時には、単純に「なぜあなたは泣いているの?」というような質問をするだけで、その人の行動の理由を知ることができることもあります。しかしながら、個人がその質問に正直に答えるのが不愉快であったり、気が進まなかったりする場合や、答えることができない場合もあります。たとえば、乳児はなぜ泣いているのかを説明することができないでしょう。このような状況では、心理学者は、行動をよりよく理解するような方法を見つけるために創造的にならなければなりません。この章では、科学的な知識がどのようにして生み出されるのか、また、その知識が私たちの個人的な生活や公共の領域での意思決定を形作る上でどれほど重要であるかを探っていきます。

研究情報の利用

どの理論が科学界に受け入れられるのか、また受け入れられないのかを判断することは、特に心理学のような幅広い研究分野では難しいことです。私たちの手元には、かつてないほどまでの信じられない量の情報があり、何らかの研究トピックをインターネットで簡単に検索するだけで、矛盾した研究がたくさん出てくることがあります。このような場合、私たちは科学界が意見の一致に到達しようとする過程を経るところを目の当たりにしており、意見の一致が得られるまでにはかなりの時間がかかるかもしれません。たとえば、私たちのテクノロジーの利用が爆発的に増えたことで、研究者たちはそれが究極的に私たちを助けているのか、妨げているのかという疑問を抱いています。教育現場でのテクノロジーの使用と導入は、ここ数十年の間に広く行われるようになりました。研究者たちは、テクノロジーの使用に関してさまざまな結論を出しています。この点を説明するために、外科研修医(外科研修中の大学院生)を対象としたスマートフォンアプリを調査した研究では、このアプリを使用することで、学生の関与を増進させ、テストの得点を上げることができることがわかりました(Shaw & Tan, 2015)。逆に、別の研究では、学部生の集団におけるテクノロジーの使用は、睡眠、コミュニケーション、時間管理能力に負の影響を与えることがわかりました(Massimini & Peterson, 2009)。十分な量の研究が行われるまでは、テクノロジーが学生の知識習得、学習スキル、メンタルヘルスに与える影響について、明確な意見の一致が得られることはないでしょう。

それまでの間、私たちはある程度の健全な懐疑的態度を行使することによって、私たちの遭遇する情報について批判的に考えるように努めるべきです。誰かがある主張をしたとき、私たちはその主張を多くの異なる視点から検証するべきです:その主張をしている人の専門分野は何でしょうか?、もしその主張が妥当であるとしたら、彼らは何を得ることができるでしょうか?、その主張は与えられた証拠から見て正当であると思われるでしょうか?、他の研究者はその主張をどう考えているでしょうか?、などです。これは、広告キャンペーンやインターネット上で「科学的証拠」に基づいていると主張しているものの、実際には製品を販売したり、自分たちの視点に注目を集めたりしようとしているほんの少数の個人の信念や視点でしかないような情報がいかに多いかを考えると、特に重要なことです。

私たちは、自分たちにとって利用可能となった情報について、情報に基づく消費者となるべきです。なぜなら、この情報に基づいた意思決定は重大な結果をもたらすからです。そのような結果の1つは、政治や公共政策の中で見ることができます。あなたが自分の州の知事に当選したところを想像してみてください。あなたの責務の1つは、州予算を管理し、有権者の税金をどのように使うのが最善かを決定することです。新しく知事になったあなたは、早期介入プログラムへの資金提供を継続するかどうかを決定する必要があります。これらのプログラムは、低所得者層の出身であったり、特別な必要性があったり、あるいはその他の不利益に直面したりしている子供たちを支援するために設計されています。これらのプログラムには、子供たちの発達を最大化し、学校やその後の人生で最適なレベルで成功を収めることができるように、さまざまなサービスを提供することが含まれている場合があります(Blann, 2005)。そのようなプログラムは魅力的に聞こえますが、あなたは、これらのプログラムに追加の資金を投資する前に、それらが効果的であると証明されていることも確認したいと思うでしょう。幸いなことに、心理学者や他の科学者がこのようなプログラムについて膨大な量の研究を行っており、一般的にそのプログラムは効果的であることがわかっています(Neil & Christensen, 2009; Peters-Scheffer, Didden, Korzilius, & Sturmey, 2011)。すべてのプログラムが等しく効果があるわけではなく、そのようなプログラムの多くは短期的な効果のほうがより顕著ですが、これらのプログラムの多くは参加者に長期的な利益をもたらすと信じるに足る理由があります(Barnett, 2011)。もしあなたが納税者のお金の良き管理人であることを誓約しているのであれば、あなたは研究に目を向けることを望むでしょう。どのプログラムが最も効果的でしょうか?これらのプログラムのどのような特徴が、それらを効果的にしているのでしょうか?どのプログラムが最も良い結果をもたらしているでしょうか?研究を調べた後には、あなたはどのプログラムに資金を提供すべきかを決定するのに最適な準備ができていることでしょう。

学習へのリンク

幼児期のプログラムの有効性についてのこのビデオ(http://openstax.org/l/programeffect)を見ると、科学者がどのように有効性を評価しているかや、最も効果的なプログラムに資金を投入するための最善の方法を学ぶことができます。

究極的には、意思決定を導き出すに際して研究を利用することから恩恵を受けることができるのは、政治家だけではありません。私たちは誰でも、生活の中で意思決定をする際に、折に触れて研究に目を向けることがあるかもしれません。親しい友人が乳がんになったところや、最近若い親戚の1人が自閉症と診断されたところを想像してみてください。いずれの場合も、あなたはどの治療法が最も少ない副作用で最もうまくいく治療法なのかを知りたいと願います。あなたはどのようにしてそれを見出すでしょうか?あなたはおそらく、自分の主治医に相談し、さまざまな治療の選択肢に関して行われた研究を個人的に検討するでしょう—可能な限りの情報を得るためには、常に批判的な目で見る必要があります。

結局のところ、事実と意見との間に違いを作り出すのが研究です。事実は観察可能な現実であり、意見は個人的な判断、結論、または態度であり、それらは正確であるかもしれないし、正確でないかもしれません。科学の世界では、事実は経験主義的な研究を通じて収集された証拠を用いてのみ確立することができます。

著名な研究者

心理学の研究には長い歴史があり、その中には多様な背景を持つ重要な人物が関わっています。入門の章では、この学問分野に大きく貢献した幾人かの研究者のことを議論しましたが、その仕事を通じて心理学が科学としてどのように発展してきたかを考える上で注目に値する人物は他にもたくさんいます(図2.3)。たとえば、マーガレット・フロイ・ウォッシュバーン(1871-1939)は、心理学で博士号を取得した最初の女性でした。彼女の研究は、動物の行動と認知に焦点を当てていました(Margaret Floy Washburn, PhD, n.d.)。メアリー・ウィットン・カルキンズ(1863-1930)は傑出した第一世代のアメリカの心理学者であり、行動主義の動きに反対し、記憶に関する重要な研究を行い、米国で最も初期の実験心理学研究室の1つを設立しました(Mary Whiton Calkins, n.d.)。

フランシス・サムナー(1895-1954)は、1920年に心理学で博士号を取得した最初のアフリカ系アメリカ人となりました。彼の学位論文は、精神分析に関連する諸問題に焦点を当てていました。サムナーはまた、人種的偏見と教育的正義の研究にも関心を持っていました。サムナーはハワード大学の心理学部の創設者の1人であり、その業績から「黒人心理学の父」と呼ばれることもあります。13年後、イネス・ビバリー・プロッサー(1895-1934)は、心理学の博士号を取得した初のアフリカ系アメリカ人女性となりました。プロッサーの研究は、人種的に分離された学校と統合された学校での教育に関連する問題を強調していました。最終的に、彼女の研究は、公立学校の人種的な分離が違憲であるとする画期的なブラウン対教育委員会の連邦最高裁判決において、非常に大きな影響力を持ちました(Ethnicity and Health in America Series: Featured Psychologists, n.d.)。

図2.3 | (a)マーガレット・フロイ・ウォッシュバーンは、心理学の博士号を取得した最初の女性でした。(b)ブラウン対教育委員会訴訟の結果は、心理学の博士号を取得した初のアフリカ系アメリカ人女性である心理学者イネス・ビバリー・プロッサーの研究に影響を受けていました。

心理学の科学的なルーツの確立は、ヨーロッパと米国において最初に起こりましたが、世界中の研究者が独自の研究室や研究プログラムを設立し始めるまでには、それほど時間はかかりませんでした。たとえば、南米における最初の実験心理学の研究室のいくつかは、ホレイショ・ピニェーロ(1869-1919)によってアルゼンチンのブエノスアイレスにある2つの研究施設に設立されました(Godoy & Brussino, 2010)。インドでは、グナムディアン・デイヴィッド・ボアズ(1908-1965)とナレンドラ・ナス・セン・グプタ(1889-1944)が、それぞれマドラス大学とカルカッタ大学に最初の独立した心理学の学部を設立しました。これらの発展は、インドの研究者がこの分野に重要な貢献をする機会を提供しました(Gunamudian David Boaz, n.d.; Narendra Nath Sen Gupta, n.d.)。

1892年にアメリカ心理学会(APA)が設立された当初は、会員はすべて白人男性でした(Women and Minorities in Psychology, n.d.)。しかしながら、1905年にはメアリー・ウィットン・カルキンズがAPAの最初の女性会長に選出され、1946年にはアメリカの心理学者の4分の1近くが女性になりました。心理学は、アメリカの歴史的に黒人の多い高等教育機関に入学した学生にとって人気のある学位の選択肢となり、心理学者になるために進む黒人のアメリカ人の数が増加しました。米国で起きている人口動態の変化と、歴史的に軽視されてきた人々の間で高等教育の機会へのアクセスが増加していることを考えると、この分野の多様性がより大きな人口にますます合致するようになり、将来の心理学者による研究貢献が、あらゆる背景を持つ人々により良く役立つようになることを期待するに足る理由があります(Women and Minorities in Psychology, n.d.)。

科学的研究のプロセス

科学的な知識は、科学的方法として知られているプロセスを経て進展していきます。基本的には、(理論や仮説の形の)アイデアが、現実世界に対して(経験主義的観測の形で)テストされます。そして、その経験主義的観測がさらに多くのアイデアにつながり、それが現実世界に対してテストされることになる、というように続いていきます。この意味で、科学的プロセスは円環です。この円の中の推論のタイプは、演繹的推論と帰納的推論と呼ばれています。演繹的推論では、アイデアは現実世界で検証され、帰納的推論では、現実世界での観察が新しいアイデアにつながります(図2.4)。これらのプロセスは、呼気と吸気と同じように切り離せないものですが、研究のアプローチによって、演繹的側面と帰納的側面に重きを置いている点が異なっています。

図2.4 | 心理学研究は帰納的推論と演繹的推論の両方に依拠しています。

科学的な文脈では、演繹的推論は、一般化(1つの仮説)から始まり、それが現実世界についての論理的な結論に到達するために使用されます。もし仮説が正しければ、演繹的推論を通じて到達した論理的結論も正しいはずです。演繹的推論の議論は次のように進むことがあります:「すべての生物は生存するためにエネルギーを必要とする(これがあなたの仮説でしょう)。アヒルは生き物である。したがって、アヒルは生存するためにエネルギーを必要とする(論理的結論)。」この例では、仮説は正しいです。したがって、結論も正しいです。しかしながら、時には、間違った仮説が、論理的ではあるものの間違った結論につながることがあります。この議論を考えてみましょう:「すべてのアヒルは生まれつき視力を持っている。アヒルの鳴きまね人形はアヒルである。したがって、アヒルの鳴きまね人形は視力を持って生まれてきた。」科学者は演繹的推論を使って自分の仮説を経験主義的に検証します。アヒルの例に戻ると、研究者は、「すべての生物が生存するためにエネルギーを必要とするならば、アヒルは生存するためにエネルギーを必要とすることが判明するだろう」という仮説をテストするための研究を設計するかもしれません。

演繹的推論は一般化から始まり、それが実世界の観察に対してテストされます。しかしながら、帰納的推論は逆の方向に進みます。帰納的推論では、経験主義的な観察を使用して広範な一般化を構築します。演繹的推論とは異なり、帰納的推論から導き出された結論は、その根拠となる観察に関係なく、正しいかもしれないし、正しくないかもしれません。たとえば、あなたは、自分の好きな果物(リンゴ、バナナ、およびオレンジ)はすべて木になっていることに気づくかもしれません。したがって、あなたは、すべての果物は木になっていなければならないと推測します。これは帰納的推論の例です。そして、この一般化は多くの直接的な観察に基づいているにもかかわらず、イチゴ、ブルーベリー、キウイの存在のために正しくない、ということが明確に実証されることになります。科学者は帰納的推論を使って理論を立て、その理論が仮説を生み出し、その仮説が演繹的推論を使って検証されます。結局のところ、科学には演繹的なプロセスと帰納的なプロセスの両方が含まれています。

たとえば、あなたが次の節で読むことになる事例研究では、経験主義的な観察の側面に重きを置いています。したがって、事例研究は帰納的なプロセスと密接に関連しており、研究者は大量の観察を集め、データの中から興味深いパターン(新しいアイデア)を探し出します。一方、実験研究は演繹的推論を重視しています。

私たちは理論や仮説がアイデアであると述べましたが、それらは厳密にはどのようなアイデアなのでしょうか?理論とは、観察された現象の説明を提案するような、よく練られた一連のアイデアのことです。理論は繰り返し世界と照らし合わせて検証されますが、それらは一度にすべてを検証するには複雑すぎる傾向があります。その代わりとして、研究者は理論の特定の側面をテストするための仮説を作成します。

仮説とは、私たちのアイデアが正しければ世界がどのように振る舞うかについての検証可能な予測のことであり、しばしば「if-then(もし~ならば、…だろう)」文として表現されることがあります(例:もし私が徹夜で勉強したならば、私はテストで合格点を取るだろう)。仮説は、アイデアの領域と現実世界との間の隔たりに橋をかけてくれるため、非常に重要なものです。具体的な仮説が検証されると、理論は、これらのテストの結果を反映して組み込むために、修正され、改良されます(図2.5)。

図2.5 | 科学的方法には、理論から仮説を導き出し、それらの仮説を検証することが含まれます。もしその結果が理論と一致していれば、その理論は裏付けられることになります。もし結果が一致していなければ、その理論を修正し、新しい仮説を立てることになります。

このプロセスがどのように機能するかを見るために、具体的な理論と、その理論から立てることができそうな仮説を考えてみましょう。あなたが後の章で学ぶように、感情についてのジェームズ-ランゲ理論では、感情の経験は、感情状態に関連した生理学的覚醒に依拠していると主張しています。もしあなたが家の外に出ようとして、玄関先で非常に攻撃的なヘビが待ち構えているのを発見したら、あなたの心臓はバクバクし始め、胃が痛くなるでしょう。ジェームズ-ランゲ理論によると、これらの生理学的変化が恐怖の感情をもたらすことになります。この理論から導き出される仮説は、「蛇を見たことによって引き起こされる生理学的覚醒に気づかない人は恐怖を感じない」というものになるかもしれません。

科学的な仮説とは、反証可能なもの、つまり、間違っていることを示すことができるものでもあります。入門の章で、ジークムント・フロイトは人間のさまざまな行動を説明するために多くの興味深いアイデアを持っていた、と述べたことを思い出してください(図2.6)。しかしながら、フロイトの理論に対する主な批判は、彼のアイデアの多くは検証可能なものではない、というものです。たとえば、フロイトの理論で記述されている人格の3つの要素である「イド」「自我」「超自我」の存在が誤りであることを証明できるような経験主義的な観察を思いつくのは不可能です。それにもかかわらず、フロイトの理論は、人格心理学や心理療法についての歴史的意義のために、心理学の入門教科書で広く教えられており、現代のすべての形態のセラピーの根幹を今でもなしています。

図2.6 | (a)フロイトの理論の詳細、たとえば、(b)心をイド、自我、超自我に分割したことなどは、最近の数十年の間に、支持されなくなっています。なぜなら、それらは反証可能なものではないからです。大まかに見てみると、彼の見解は、今日の心理学的思考の多くのための舞台を設定しました(たとえば、心理的プロセスの大部分についての無意識の性質など)。

対照的に、ジェームズ-ランゲ理論は、上述したもののように、反証可能な仮説を生み出します。脊柱に大きな損傷を受けた人の中には、感情的な経験にしばしば伴う身体の変化を感じることができない人がいます。したがって、私たちは、このような生理学的覚醒の変化を感知する能力を持つ個人とそうでない個人との間で、感情的経験がどのように異なるのかを特定することによって、この仮説を検証することができます。実際に、この研究が行われており、生理学的覚醒の意識を奪われた人の感情経験はそれほど激しいものではないかもしれませんが、それでも彼らは感情を経験しています(Chwalisz, Diener, & Gallagher, 1988)。

科学的研究は、反証可能性に依拠しているため、それが生み出す情報に大きな信頼を置くことができます。典型的には、情報が科学界に受け入れられるようになるまでには、それは繰り返しテストされています。

2.2 研究へのアプローチ

学習目標

この節が終わるまでに、あなたは次のことができるようになります:

  • 心理学者によって使用されるさまざまな研究方法を記述する
  • 事例研究、自然主義的観察、調査(サーベイ)、およびアーカイブ研究の長所と短所を議論する
  • 研究の縦断的アプローチと横断的アプローチを比較する
  • 相関関係と因果関係を比較対照する

心理学者が行動とその根底にある認知的・生物学的プロセスを理解し、記述し、説明しようとする取り組みの中で利用することのできる研究方法は数多くあります。いくつかの方法は観察技術に依拠しています。その他のアプローチでは、研究者と研究対象の個人との間の相互作用を伴うものもあり、それは一連の簡単な質問から広範で綿密なインタビュー、そしてよく統制された実験に至るまで多岐にわたっています。

これらの研究方法にはそれぞれ独自の長所と短所があり、それぞれの方法が特定のタイプの研究の質問にのみ適している場合もあります。たとえば、主に観察に頼った研究では、膨大な量の情報が得られますが、標本数が少ないために、この情報をより大きな集団へと適用する能力にはいくらか限界があります。一方、調査(サーベイ)研究では、研究者は比較的大規模な標本から簡単にデータを収集することができます。このため、結果をより大きな集団に一般化することが容易になりますが、どのような調査であっても収集できる情報はやや限られており、あらゆる種類の自己申告データに伴う問題を抱えています。既存の記録を利用することによりアーカイブ研究を行う研究者もいます。これは、多くの研究の質問に対する洞察を提供してくれるようなデータを収集するためのかなり安価な方法ですが、このアプローチを使用する研究者は、どのような種類のデータがどのようにして収集されたかを制御することはできません。これまでに説明した方法はすべて、相関関係の性質を持つものです。これは、研究者が関心のある2つかそれ以上の変数の間に存在するかもしれない重要な関係性を語ることができることを意味します。しかしながら、相関関係のあるデータは、因果関係についての主張をするために使うことはできません。

相関研究では、2つの変数間の関係性を見つけることができますが、研究者が変数間の関係性が因果関係であると主張できる唯一の方法は、実験を行うことです。この章で後述する実験研究では、関心のある変数に対して非常に多くの統制をかけます。これは強力なアプローチですが、実験はしばしば非常に人工的な環境で行われます。このことは、現実世界の環境でどのように適用されるかという点で、実験に基づく知見の妥当性に疑問を投げかけています。さらに、心理学者が答えを出したいと思っている疑問の多くは、倫理的な懸念があるために、実験研究を通じて追求することができません。

臨床研究または事例研究

2011年、ニューヨーク・タイムズ紙はカナダの双子の女の子、クリスタ・ホーガンとタチアナ・ホーガンの特集記事を掲載しました。クリスタとタチアナは頭でつながっている結合双生児であることから、この2人の双子はユニークな存在です。この2人の女の子は視床と呼ばれる脳の一部でつながっているという証拠があります。視床は、主要な感覚中継センターです。入ってくる感覚情報のほとんどは、視床を通って送られ、その後に大脳皮質の高次の領域に到達して処理されます。

学習へのリンク

クリスタとタチアナの人生についてのCBCのビデオ(http://openstax.org/l/hogans)を見て、さらに学んでください。

この潜在的なつながりから推測されることは、双子の片方が双子のもう片方の感覚を経験できる可能性があることを意味しています。たとえば、もしクリスタが特に面白いテレビ番組を見ていたら、タチアナはその番組を見ていなくても微笑んだり笑ったりするかもしれません。この特別な可能性は、脳が感覚情報をどのように利用しているかを理解しようとする多くの神経科学者の興味を掻き立てています。

この双子は脳の研究における途方もない手助けとなります。また、その症状は非常に稀なものであるため、家族が同意する限りにおいて、科学者たちは可能な限り多くの情報を得るために、生涯にわたってこの双子を非常に注意深く観察し続けることになるでしょう(Dominus, 2011)。

時間が経つにつれて、クリスタとタチアナは感覚的な経験と運動制御を共有しているものの、彼女たちは2人の別個の個人のままであることが明らかになってきました。これは、心と脳に興味のある研究者に多大な洞察を提供しています(Egnor, 2017)。

観察研究に際して、科学者が1人の人やほんの数人の個人に焦点を当てる場合、彼らは臨床研究事例研究を行っています。実際、10~20人の個人だけを研究することにキャリア全体を費やす科学者もいます。なぜ彼らはこのようなことをするのでしょうか?明らかに、非常に少数の人々に注意を集中すると、彼らはそれらの事例について途方もない量の洞察を得ることができるからです。臨床研究や事例研究で収集される情報の豊かさは、他のどのような単一の研究方法とも比較にならないほどです。これにより、研究者は研究対象となる個人や特定の現象について非常に深い理解を得ることができます。

臨床研究や事例研究がそんなにも多くの情報を提供してくれるのならば、なぜ研究者の間でもっと頻繁に行われていないのでしょうか?結局のところ、この特定のアプローチの大きな利点は弱点でもあります。前述したように、このアプローチは、個人を研究する場合にしばしば使われますが、そのような個人は稀な特質を持っているために研究者の興味を引くような人たちです。したがって、事例研究の焦点となる個人は、他のほとんどの人とは異なります。もし科学者が最終的にすべての行動を説明したいと望んでいるのであれば、このような特別な人々のグループに注目することは、観察結果をより大きな集団全体に一般化することを難しくする可能性があります。一般化とは、特定の研究プロジェクトで得られた知見を社会のより大きな部分に適用する能力のことを指しています。繰り返しになりますが、事例研究は膨大な量の情報を提供してくれるものの、その事例があまりにも特定のものであるために、学んだことを平均的な人に適用できる可能性は非常に限られているかもしれません。

自然主義的観察

もしあなたが、行動はどのようにして起こるのかを理解したい場合、情報を得るための最良の方法の1つは、単にその行動をその自然な文脈の中で観察することです。しかしながら、人々が観察されているということを知っているならば、彼らはその行動を予期しない方法で変えるかもしれません。人々が自然な行動を隠す傾向がある場合、研究者はどのようにすれば正確な情報を得ることができるでしょうか?一例として、あなたの教授が教室の中の全員に「トイレを使った後に必ず手を洗う人は、手を挙げてください」と頼んだところを想像してください。教室のほぼ全員が手を挙げる可能性がありますが、トイレに行くたびに手を洗うことが本当に普遍的なことだとあなたは思いますか?

これは、この章の冒頭で述べた現象と非常によく似ています:多くの個人は、質問に正直に答えることに抵抗を感じます。しかし、もし私たちが手洗いについての事実を見つけ出したいと思うのであれば、私たちには利用可能な他の選択肢もあります。

私たちがクラスメートをトイレに行かせて、全員がトイレを使った後に手を洗っているかどうかを実際に観察したとします。白衣を着て、クリップボードを手に持って座り、洗面台を見つめることによって、観察者はトイレの環境の中に溶け込んでいるでしょうか?研究者には目立たないようにしてもらいたいものです—たとえば、洗面台の一角に立ってコンタクトレンズを装着するふりをしながら、こっそりと関連情報を記録するなど。この種の観察研究は自然主義的観察と呼ばれています:それは、自然な状況における行動を観察するものです。スザンヌ・ファンガーは、仲間はずれをよりよく理解するために、テキサス大学の同僚と共同で、遊び場での未就学児の行動を観察しました。観察者はどのようにして研究期間中、目立たないようにしていたのでしょうか?彼女らは、数人の子供たちにワイヤレスマイク(子供たちはすぐに忘れてしまいます)を装着し、離れた場所からメモを取りながら観察しました。また、その特定の幼稚園(「実験幼稚園」)の子供たちは、遊び場に観察者がいることに慣れていました(Fanger, Frankel, & Hazen, 2012)。

観察者ができるだけ控えめに、できるだけ目立たないようにすることが重要です:人々は彼らが見られていることを知っているとき、自然に行動する可能性が低くなります。もしあなたがこのことについて疑いを持っているならば、2つの状況で自分の運転行動がどのように異なるかを自分自身に問うてみてください:最初の状況では、あなたは真昼間に閑散とした高速道路を運転しています。2つ目の状況では、あなたは同じ閑散とした高速道路で、後ろにパトカーがついてきています(図2.7)。

図2.7 | 後ろにパトカーがいるのを目にすると、おそらくあなたの運転行動に影響を与えるでしょう。(credit: Michael Gil)

自然主義的観察は人間が関連する研究に限ったことではないというのを指摘しておくべきでしょう。実際、自然主義的観察の最もよく知られた例のいくつかは、研究者が野外に出て、さまざまな種類の動物をそれら自身の環境の中で観察したものです。人間の研究と同じように、研究者は動物の自然な行動に影響を与えないように、対象の動物との距離を保ち、干渉を避けます。科学者は、この手法を用いて、リスからゴリラに至るまで、さまざまな動物の社会階層や相互作用を研究してきました。これらの研究によって与えられた情報は、これらの動物がどのようにして社会的に組織化され、お互いにコミュニケーションをとっているのかを理解する上で非常に貴重なものです。たとえば、人類学者のジェーン・グドールは、アフリカのチンパンジーの行動を観察するのに約50年を費やしました(図2.8)。研究者が自然主義的観察をする際に遭遇するであろう懸念事項を例示するものですが、一部の科学者は、グドールがチンパンジーを数字で参照するのではなく名前をつけたことを批判しました—名前を使うことは、研究の客観性に必要な感情的な切り離しを損なうと考えられていました(McKie, 2010)。

図2.8 | (a)ジェーン・グドールは、(b)チンパンジーの行動の自然主義的観察を行うことを生涯の仕事としていました。(credit “Jane Goodall”: modification of work by Erik Hersman; “chimpanzee”: modification of work by “Afrika Force”/Flickr.com)

自然主義的観察の最大の利点は、自然な状況の中で目立つことなく収集された情報の妥当性、つまり正確さです。個人が所与の状況で通常であればするであろう行動をさせるということは、私たちが他の研究アプローチで達成することができるよりも高いレベルの生態学的妥当性、つまりリアリズムが得られるということを意味します。したがって、研究結果を現実世界の状況に一般化する能力が高まります。もし正しく行われるのであれば、単に観察されているからという理由で人々や動物が行動を変えることを心配する必要はありません。時には人々は、リアリティー番組が本物の人間の行動を私たちに垣間見せているのではないかと思い込むかもしれません。しかしながら、リアリティー番組の出演者がカメラクルーに付きまとわれたり、個人的な告白のためにカメラの前でインタビューを受けたりすると、目立たないように観察するという原則が破られてしまいます。そのような環境を考慮すると、彼らの行動がどれほど自然でリアルなものであるかについて、私たちは疑わざるを得ません。

自然主義的観察の大きな欠点は、設定や統制が難しいことが多いということです。私たちのトイレ研究では、人々の手洗い行動を記録するために準備して一日中トイレに立っていたのに、誰も入ってこなかったとしたらどうしましょうか?あるいは、ゴリラの群れを何週間も入念に観察していたのに、あなたがテントの中で寝ている間にゴリラが新しい場所に移動してしまったとしたらどうでしょうか?現実的なデータの利点は、代償を伴うものです。研究者であるあなたは、観察しようとする行動をいつ観察できるか(あるいは観察できるかどうか)をコントロールすることができません。さらに、この種の観察研究では、しばしば時間とお金、そしてかなりの幸運を大量に注ぎ込むことを必要とします。

研究には、構造化された観察が含まれることがあります。このような場合、人々は、設定された特定の課題に従事している間に観察されることになります。構造化された観察の優れた例としては、メアリー・エインスワースの「奇異な状況」があります(これについては、あなたは生涯発達の章で詳しく読むことになります)。「奇異な状況」は、幼児と保育者の間に存在する愛着のスタイルを評価するために使用される手順です。このシナリオでは、保育者は幼児をおもちゃでいっぱいの部屋に連れてきます。「奇異な状況」では、見知らぬ人が部屋に入ってくる、保育者が部屋を出る、保育者が部屋に戻ってくるなどといった、いくつかの段階があります。幼児の行動は各段階で綿密に監視されますが、幼児の保育者との再会時の行動こそが、保育者に対する幼児の愛着のスタイルを特徴付けるという点で最も重要な意味を持ちます。

観察研究におけるもう1つの潜在的な問題は、観察者バイアスです。一般的に、観察者として活動する人々は研究プロジェクトに密接に関与しており、無意識のうちに研究目標や期待に合うように観察を歪めてしまうことがあります。この種のバイアスから守るために、研究者は、記録される行動のタイプと、それらの行動をどのように分類すべきかについて明確な基準を確立しておくべきです。さらに、研究者はしばしば、評価者間信頼性をテストするために、複数の観察者による同じ出来事の観察を比較します:評価者間信頼性とは、異なる観察者による観察の一貫性を評価する信頼性の尺度です。

調査(サーベイ)

心理学者は、データ収集の手段としてしばしば調査(サーベイ)を開発することがあります。調査(サーベイ)とは、研究参加者が答えるべき質問のリストであり、紙に鉛筆で書き込む質問票として提供されたり、電子的に処理されたり、口頭で実施されたりします(図2.9)。一般的に、調査自体は短時間で完了することができ、また、調査の実施が容易であるため、多くの人からデータを簡便に収集することができます。

調査は、他の研究方法によって得られるよりも大規模な標本からデータを収集することができます。標本とは、研究者が興味を持っている個人の全体的なグループである母集団から選ばれた、個人の小集団のことです。研究者は標本を研究し、その結果を母集団に一般化しようとします。一般的に、研究者は収集したデータから中心傾向のさまざまな尺度を計算することによって、このプロセスを開始します。これらの尺度は、典型的な回答がどのようなものであるかについての全体的な要約を提供してくれます。中心傾向には、最頻値、中央値、および平均値という3つの尺度があります。最頻値は最も頻繁に発生する反応であり、中央値は与えられたデータセットの中央に位置するものであり、平均値はすべてのデータ点の算術平均です。平均値は、以下に説明するような追加分析を行う際に最も有用である傾向があります。しかしながら、平均値は外れ値の影響を非常に受けやすいので、中心傾向の尺度が問題としているデータセットについて何を教えてくれるのかを評価する際には、その影響に注意しなければなりません。

図2.9 | 調査は、ここに示されている調査のように電子的に管理されたものを含め、多くの方法で実施することができます。(credit: Robert Nyman)

事例研究と比較して、調査には強みと弱みがあります。調査を使用することによって、私たちはより多くの人の標本から情報を収集することができます。標本が大きいほど、母集団の実際の多様性をより良く反映することができるので、より良い一般化可能性を得ることができます。したがって、もし私たちの標本が十分に大きく多様であれば、調査で収集したデータは、事例研究で収集した情報よりも高い確実さをもって、より大きな母集団に一般化できると考えることができます。しかしながら、関与する人の数の多さを踏まえると、事例研究で収集するのと同じ深さでそれぞれの人の情報を収集することはできません。

調査のもう1つの潜在的な弱点は、この章で先に触れたことです:人々は常に正確な回答をするとは限りません。彼らは、嘘をついたり、記憶違いをしたり、自分を良く見せると思うやり方で質問に答えたりすることがあります。たとえば、人々は実際の飲酒量よりも少ない飲酒量を報告するかもしれません。

調査を利用することで、多くの研究の質問に答えることができます。現実世界の1つの例としては、ジェンキンス、ルッペル、カイザー、イェールおよびグリフィスが2001年9月11日のテロ攻撃後に実施した、米国のアラブ系アメリカ人コミュニティーに対する反発についての調査があります(Jenkins, Ruppel, Kizer, Yehl, and Griffin, 2012)。ジェンキンスと同僚らは、アラブ系アメリカ人に対するこうした否定的な態度が、テロ事件発生から10年近く経ってもまだどの程度残っているのかを調べようとしました。ある研究では、140人の研究参加者が、さまざまな民族の人々に対する参加者のあからさまな偏見的態度について直接尋ねる質問を含む、10の質問からなる調査表に記入しました。また、この調査では、参加者がさまざまな場面で特定の民族の人と交流する可能性について間接的に質問しました(たとえば、「アラブ系アメリカ人の出自の人に対して自己紹介する可能性はどのくらいだと思いますか?」など)。この研究の結果、参加者はどの民族グループに対しても偏見的な態度を報告したがらないことが示唆されました。しかしながら、アラブ系アメリカ人との社会的交流についての質問に対する回答パターンには、他の民族グループと比較して有意な差がありました:それらは、アラブ系アメリカ人との社会的交流への意欲が、他の民族と比較して低いことを示していました。このことは、参加者がそうではないと主張しているにもかかわらず、彼らはアラブ系アメリカ人に対する微妙な形の先入観を心に抱いていることを示唆しています(Jenkins et al., 2012)。

アーカイブ研究

研究者の中には、1人の研究参加者とも交流することなく、大量のデータにアクセスする人もいます。彼らは、参加者と交流する代わりに、既存の記録を利用してさまざまな研究の質問に答えます。この種の研究アプローチは、アーカイブ研究として知られています。アーカイブ研究では、過去の記録やデータセットに目を通し、興味深いパターンや関係性を探すことに頼ります。

たとえば、ある研究者は、過去10年以内に大学に入学したすべての人の学業記録にアクセスして、彼らが学位取得までにどれくらいの時間がかかったかや、講座の負担、成績、および課外活動への参加などを計算するかもしれません。アーカイブ研究は、どのような人が教育を修了する可能性が最も高いのかについての重要な情報を提供し、学業不振の学生についての重要な危険因子を特定するのに役立つ可能性があります(図2.10)。

図2.10 | アーカイブ研究を行う研究者は、(a)ハードコピーとして保存されているか、(b)電子的に保存されているかにかかわらず、記録を調査します。(credit “paper files”: modification of work by “Newtown graffiti”/Flickr; “computer”: modification of work by INPIVIC Family/Flickr)

アーカイブ研究を他の研究方法と比較すると、そこにはいくつかの重要な違いがあります。1つ目としては、アーカイブ研究を採用している研究者は、研究参加者と直接交流することがありません。そのため、データを収集するための時間と費用の投資は、アーカイブ研究ではかなり少なくて済みます。それに加えて、研究者は当初どのような情報が収集されたかを管理することができません。そのため、研究の質問は、既存のデータセットの構造の中で答えられるものであるように調整しなければなりません。また、ある情報源と別の情報源との記録の間に一貫性があるという保証もないため、異なるデータセットを比較対照することが問題となる場合があります。

縦断的研究と横断的研究

私たちは、人間の発達や生涯の研究のように、時間の経過とともに人がどのように変化していくのかを理解したいと思うことがあります。私たちが同じグループの個人に対して長期間にわたって繰り返しテストをするとき、私たちは縦断的研究を行っていることになります。縦断的研究とは、データ収集を長期間にわたって繰り返し行う研究デザインのことです。たとえば、私たちは、人々の集団に対して20歳で食習慣を調査し、10年後の30歳で再調査し、40歳で再調査することができます。

もう1つのアプローチは、横断的研究です。横断的研究では、研究者が同じ時間における母集団の複数の部分を比較します。上記の食習慣の例を用いると、研究者は年齢別の異なるグループの人々を直接比較することになります。研究者は、あるグループの人々を20年間調査して、彼らの食習慣が10年ごとにどのように変化したかを見るのではなく、20歳の人々のグループを調査して、彼らを30歳の人々のグループや40歳の人々のグループと比較します。横断的研究に必要な時間は短い期間で済みます。また一方では、その研究は、異なる世代(またはコホート)の間に存在する違いによって制限されています。その違いは年齢自体とは関係なく、むしろ異なる世代の個人を互いに異なるものにするような社会的・文化的経験を反映しています。

この概念を説明するために、以下の調査結果のことを考えてみましょう。近年、同性婚への人々の支持が大幅に増加しています。このトピックに関する多くの研究では、調査参加者を年齢層別に分類しています。一般的に、年齢が高い人よりも若い人の方が同性婚を支持しています(Jones, 2013)。これは、私たちが年齢を重ねるにつれ、同性婚に対する開かれた考え方が減っていくことを意味するのでしょうか?それとも、年齢の高い人たちが育った社会環境のために、彼らが異なる視点を持っていることを意味しているのでしょうか?縦断的研究は、同じ個人が長期間にわたって研究プロジェクトに参加しているため、強力なアプローチです。それは、コホート間の違いが研究結果に与える影響を、研究者はあまり気にする必要がないということを意味します。

特定の危険因子を理解するためにさまざまな疾患を研究する際には、しばしば縦断的研究が採用されます。このような研究では、しばしば数万人の個人を数十年にわたって追跡調査することがあります。このような研究に参加する人の数が膨大であることを考えると、研究者は自分たちの知見をより大きな集団に一般化することができるという確信を持つことができます。がん予防研究-3(Cancer Prevention Study-3:CPS-3)は、アメリカがん協会が主催する一連の縦断的研究の1つであり、がんに関連する予測危険因子を明らかにすることを目的としています。参加者は、この研究に参加する際に、自分の生活や家族の経歴についての調査に記入し、がんの発生を引き起こしたり予防したりする可能性のある因子についての情報を提供します。その後、数年ごとに参加者は追加の調査に記入することになります。最終的には、何十万人もの参加者を20年間にわたって追跡して、どの参加者ががんになるか、あるいはならないかを判断することになります。

この種の研究は明らかに重要であり、非常に参考になる可能性を秘めています。たとえば、アメリカがん協会が主催した初期の縦断的研究では、今となっては確立されているがんの発生率の増加と喫煙との間の関連性を、科学的に初めて実証しました(American Cancer Society, n.d.)(図2.11)。

図2.11 | CPS-3のような縦断的研究は、喫煙ががんやその他の疾患とどのように関連しているかをよりよく理解するのに役立ちます。(credit: CDC/Debora Cartagena)

どのような研究戦略にも言えることですが、縦断的研究に限界がないわけではありません。第一に、これらの研究には、研究者と研究参加者による驚くほどの時間の投資を必要とします。縦断的研究の中には、完了するまでに数十年とまではいかないまでも何年もかかるものもあるため、結果がわかるまでには相当の期間がかかります。時間的な要求に加えて、これらの研究には多額の資金の投資が必要です。多くの研究者は、縦断的プロジェクトを最後まで見届けるために必要な資源を投入することができません。

研究参加者はまた、長期間にわたって参加を継続する意思がなければならず、これは問題となり得ます。人は引っ越しをしたり、結婚して新しい名前を名乗ったり、病気になったり、最終的には死んだりします。人生に大きな変化がなかったとしても、単にプロジェクトへの参加をやめることを選ぶ人もいるでしょう。その結果、縦断的研究における離脱率、すなわち脱落による研究参加者数の減少率は非常に高く、プロジェクトの期間にわたって増加します。この理由から、このアプローチを使用する研究者は、典型的には、かなりの数の参加者が終了前に脱落することを十分に想定して、多くの参加者を募集します。彼らは、研究が進むにつれて、まだ標本がより大きな母集団を代表しているかどうかを継続的に確認し、必要に応じて調整を行います。

2.3 成果の分析

学習目標

この節が終わるまでに、あなたは次のことができるようになります:

  • 相関係数が変数間の関係について私たちに何を教えてくれるかを説明する
  • 相関関係は変数間の因果関係を示すものではないことを認識する
  • 私たちが実際には存在しない変数間の関係を探してしまう傾向について議論する
  • 無作為抽出および実験群と対照群への参加者の割り当てについて説明する
  • 実験者や参加者のバイアスが実験結果にどのような影響を与えるかを議論する
  • 独立変数と従属変数を識別する

あなたは、アイスクリームの売り上げが増加するにつれて、犯罪の全体的な割合が増加することを知っていましたか?あなたが好きな味のアイスクリームを味わうことは、あなたを数々の犯罪へと駆り立てる可能性があるのでしょうか?あるいは、あなたは犯罪を犯した後に、アイスクリームコーンを自分へのご褒美にするかもしれないと思いますか?アイスクリームと犯罪の間に関係があることは間違いありませんが(たとえば、Harper, 2013)、一方のことが実際にもう一方のことを引き起こしたと決めつけるのはかなり愚かなことでしょう。

アイスクリームの売り上げも犯罪率も、屋外の気温が関係している可能性の方がかなり高いです。気温が暖かい時は、たくさんの人々が家の外にいて、それぞれが交流をして、お互いにイライラしたり、時には犯罪を犯したりします。また、外が暖かいと、私たちはアイスクリームのような冷たいものを求めやすくなります。2つのものの間に本当に関係があるかどうかについて、私たちはどうやって判断するのでしょうか?そして、関係がある場合、それが偶然の一致に起因するものか因果関係に起因するものかどうかをどのようにして見分けることができるのでしょうか?

相関研究

相関とは、2つかそれ以上の変数(アイスクリームの消費量と犯罪など)の間に関係があることを意味しますが、この関係は必ずしも因果関係を含意するものではありません。2つの変数が相関している場合、それは単純に、一方の変数が変化すると他方の変数も変化することを意味しているだけです。私たちは相関係数として知られる統計量を計算することによって、相関関係を測定することができます。相関係数は、変数間の関係の強さと方向性を示す-1から+1までの数値です。相関係数は通常、rという文字で表されます。

相関係数の数字の部分は、関係の強さを示します。数値が(負であろうと正であろうと)1に近いほど、それらの変数はより強く関連しており、一方の変数が変化する際の他方の変数の変化がより予測可能になります。数値が0に近いほど、関係が弱く、変数間の関係が予測しにくくなります。たとえば、相関係数0.9は、相関係数0.3よりもはるかに強い関係を示します。もし変数が互いに全く関連していないならば、相関係数は0です。上のアイスクリームと犯罪についての例は、お互いに関係がないと私たちが予想するであろう2つの変数の例です。

相関係数の(正または負の)符号は、関係の方向性を示しています(図2.12)。正の相関は、変数が同じ方向に動くことを意味します。別の言い方をすれば、一方の変数が増加すると他方の変数も増加し、逆に、一方の変数が減少すると他方の変数も減少することを意味します。負の相関は、変数が反対の方向に動くことを意味します。もし2つの変数が負の相関関係にある場合、一方の変数の減少には他方の変数の増加が付随し、その逆もまた然りです。

アイスクリームと犯罪率の例は、正の相関です。なぜなら、気温が高くなると両方の変数が増加するからです。正の相関の他の例としては、個人の身長と体重の関係や、年齢としわの数の関係などがあります。ある人の日中の疲れとその人の前夜の睡眠時間との間には負の相関があると予想されます:疲労感が増すにつれて、睡眠の量が減少しています。負の相関の現実世界の例として、ミネソタ大学の学生研究者が、学生の睡眠時間が5時間未満であった日の週当たりの平均日数とGPAとの間に弱い負の相関(r = -0.29)があることを発見しました(Lowry, Dean, & Manders, 2010)。負の相関は、相関がないことと同じではない、ということを心に留めておいてください。たとえば、おそらく私たちは睡眠時間と靴のサイズの間には何の相関も見出すことはないでしょう。

前述したように、相関には予測のための価値があります。あなたが一流大学の入試委員会にいるところを想像してみてください。あなたは膨大な数の応募者に直面していますが、その中のほんの一部の応募者しか受け入れることができません。あなたはどのようにして誰を入学させるべきかを決めることができるでしょうか?あなたは、現在通学している学生の大学のGPAと、SATやACTのような標準化されたテストの点数との関係を比較することを試みるといいでしょう。現在の学生についてどの相関が最も強いかを観察することにより、あなたはこの情報を使って、大学への入学を志願した学生の相対的な成功を予測することができます。

図2.12 | 散布図は、相関の強さと方向性をグラフ化したものです。相関が強ければ強いほど、データ点は直線に近くなります。これらの例では、(a)体重と身長の間には正の相関があり、(b)疲労度と睡眠時間の間には負の相関があり、(c)靴のサイズと睡眠時間の間には相関がないことがわかります。

学習へのリンク

このインタラクティブな散布図(http://openstax.org/l/scatplot)を操作して、正と負の相関の理解を身に着けてください。

相関は因果関係を示唆しない

相関研究は、2つの変数の間に存在する関係の強さや方向性を発見することができるので有用です。しかしながら、関係性の存在を立証することは因果関係について私たちにほとんど何も教えてくれないため、相関には限界があります。1つの変数の変化が他の変数の変化を引き起こすために変数同士が相関していることもありますが、実際には他の何らかの要因(交絡変数)が関心のある変数の系統的な動きを引き起こしている可能性もあります。先に述べたアイスクリーム/犯罪率の例では、温度が2つの変数間の関係を説明し得る交絡変数です。

私たちが明らかな交絡変数を指摘できない場合であっても、2つの変数間の相関が、片方の変数がもう片方の変数の変化を引き起こすことを含意していると仮定すべきではありません。これは、因果関係が明確で直感的に理解できるように思える場合には、イライラさせられることがあります。アメリカがん協会が行った研究と、その研究プロジェクトが喫煙とがんとのつながりを最初に示したいくつかのものであったことを思い出してください。喫煙ががんを引き起こすと仮定するのは妥当なように思えますが、もし私たちが相関研究に限定されていたとしたら、このような仮定をすることによって、私たちは限界を超えてしまうことになるでしょう。

残念なことに、人々は常に相関関係に対応する因果関係を誤って主張してしまいます。そのような主張は、特に広告やニュース記事でよく見られます。たとえば、最近の研究では、シリアルを定期的に食べる人は、ほとんどシリアルを食べない人よりも健康的な体重を達成することがわかりました(Frantzen, Treviño, Echon, Garcia-Dominic, & DiMarco, 2013; Barton et al., 2005)。シリアル会社がどのようにこの発見を喧伝するかを推理してみてください。シリアルを食べると、その人は本当に健康的な体重を維持することができるのでしょうか?あるいは、健康的な体重の人は、肥満の人やダイエットのために食事を避ける人よりも、定期的に健康的な朝食を食べる可能性が高いなどといった、他の可能な説明があるでしょうか(図2.13)?相関研究は、変数間の関係を特定する上で非常に有用ですが、主な限界は因果関係を確立することができないことです。心理学者は原因と結果についての記述をしたいと望んでいますが、それを行うための唯一の方法は、研究の質問に答えるための実験をすることです。次の項では、科学的実験がどのようにして代替的な説明を排除したり、あるいは代替的な説明について統制を行ったりする方法を取り入れているかを説明します。それにより、研究者は、ある変数の変化が別の変数の変化をどのように引き起こすかを探ることができます。

図2.13 | シリアルを食べることによって、人は本当に健康的な体重になるのでしょうか?(credit: Tim Skillern)

錯誤相関

相関研究に基づいて誤った因果関係を述べようとする誘惑は、私たちがデータを誤って解釈しがちな唯一の方法というわけではありません。私たちはまた、特に系統的でない観察では、錯誤相関という間違いを犯す傾向があります。錯誤相関、または虚偽相関は、そのような関係が存在しないのに、人々が2つのものの間に関係があると信じているときに起こります。よく知られている錯誤相関の1つは、月の満ち欠けが人間の行動に与えると言われている効果です。多くの人が、人間の行動は月の満ち欠けに影響されている、具体的には満月の時には人間は奇妙な行動をすると熱心に主張しています(図2.14)。

図2.14 | 多くの人々は、満月が人々に奇妙な行動をとらせると信じています。(credit: Cory Zanker)

月が私たちの惑星に対して強力な影響を与えていることは否定できません。海の潮の満ち引きは、月の重力と密接に結びついています。そのため、多くの人は、私たちも月の影響を受けるのは理にかなっていると信じています。結局のところ、私たちの体は主に水で構成されています。しかしながら、40近くの研究のメタ分析は一貫して、月と私たちの行動の間の関係は存在しないことを示しました(Rotton & Kelly, 1985)。私たちは月が満月のときの奇行に多くの注意を払うかもしれませんが、奇行の割合は、月の周期を通じて一定のままです。

なぜ私たちはこのような錯誤相関を信じるようになりがちなのでしょうか?しばしば、私たちはそれらについて読んだり聞いたりして、単純にもっともな情報として受け入れます。あるいは、私たちは何かがどのように機能するかについての直感を持っており、その直感を裏付ける証拠を探し、自分の直感が間違っていることを教えてくれる証拠を無視してしまうこともあります。これは確証バイアスとして知られています。他にも、最も簡単に思い浮かぶ情報に基づいて(たとえその情報が非常に限られているときであってさえ)、錯誤相関を見つけることがあります。そして、私たちはこれらの関係性を使って、私たちの周りの世界をよりよく理解し、予測することができると確信しているかもしれませんが、錯誤相関は大きな欠点となることがあります。たとえば、錯誤相関(特定の行動を特定のグループへと不正確に帰属させるようなもの)が、最終的に差別的な行動につながり得る先入観を持った態度の形成に関与していることが研究で示唆されています(Fiedler, 2004)。

因果関係:実験を実施し、データを利用する

あなたがこれまで学んできたように、2つの変数の間に因果関係があることを立証する唯一の方法は、科学的な実験を行うことです。実験は、科学的な文脈では、日常生活におけるものとは異なる意味を持ちます。日常会話では、私たちは実験という言葉のことを、新しい髪型や新しい食べ物を試すときなど、初めてのことに挑戦するときによく使います。しかしながら、科学的な文脈では、実験の設計と実施には正確な要件があります。

実験仮説

実験を行うためには、研究者は検証すべき具体的な仮説を持っていなければなりません。あなたが学んできたように、仮説は、現実世界を直接観察したり、過去の研究を精査したりすることによって立てることができます。たとえば、もしあなたが教室でのテクノロジーの使用が学習に対して悪影響を与えると考えている場合、あなたは基本的に「教室でのテクノロジーの使用は学習を低下させるので、制限されるべきである」という仮説を立てていることになります。あなたはどのようにしてこの特定の仮説を立てたのでしょうか?あなたは、ノートパソコンでノートをとっているクラスメートは、手書きでノートをとっているクラスメートに比べて、クラスのテストでの成績が低いことに気が付いたのかもしれません。あるいは、コンピュータプログラムで授業を受けた人と、直接先生に会って授業を受けた人では、テストでの成績が異なることに気が付いたのかもしれません(図2.15)。

図2.15 | 教室でのテクノロジーの使用は、学習にどのような影響を与えるでしょうか?(credit: modification of work by Nikolay Georgiev/Pixabay)

このような類の個人的な観察が、特定の仮説を立てるきっかけになることがしばしばありますが、限られた数の個人的な観察や逸話的な証拠を使って仮説を厳密に検証することはできません。その代わりに、現実世界のデータが仮説を裏付けるかどうかを見出すためには、私たちは実験を行わなければなりません。

実験を設計する

最も基本的な実験の設計では、実験群と対照群という2つのグループを必要とします。この2つのグループは、実験的操作という1つの違いを除いて、同じになるように設計されています。実験群には実験的操作、つまりテストされる治療法や変数(この例ではテクノロジーの使用)が与えられ、対照群には与えられません。実験的操作が実験群と対照群の間の唯一の違いであるため、私たちは両者の間の違いが偶然ではなく実験的操作によるものであることを確信できます。

教室でのテクノロジーの使用はどのように制限されるべきであるかという私たちの例では、実験群にはコンピュータプログラムを使って代数学を学習させ、その学習結果をテストします。対照群は、従来の教室で教師から代数学を教わった後、学習結果を測定します。対照群は、実験的操作を受けないということを除いて、実験群と同様に扱われることが重要です。

私たちはまた、代数学の学習をどのように測定するかを正確に定義する、すなわち操作することが必要です。操作的定義とは、変数を正確に記述することです。これは、研究者が特定の実験で何をどのように測定しているのかを他の人が正確に理解するために重要なものです。学習を操作する際には、私たちは、個人が教師またはコンピュータプログラムから教わる内容を網羅したテストの成績を見ることを選ぶかもしれません。私たちはまた、参加者に提示されたばかりの情報を何らかの方法で要約してもらうように頼むこともできるでしょう。いずれにしても、私たちの研究について初めて聞いた人が、「学習」という言葉によって私たちが何を意味しているのかを正確に知ることができるように、学習を操作することが重要です。そうすれば、人々が私たちのデータを解釈したり、もし人々が選択するなら実験を繰り返したりするのに役立ちます。

ひとたび、何がテクノロジーの使用と見なされるのか、何が実験参加者における学習と見なされるのかについて私たちが操作したならば、私たちは実験をどのように実施するかを決定する必要があります。今回の場合では、実験参加者に代数学を45分間学習してもらい(コンピュータプログラムを通じて、または、数学の教師と対面で)、その後、45分間で学習した内容についてテストを行います。

理想的には、実験者バイアスを統制するために、テストを採点する人は、誰が実験群に割り当てられており誰が対照群に割り当てられているかを知りません。実験者バイアスとは、研究者の予想が研究結果を歪めてしまうかもしれない可能性のことを指します。実験を行うには多くの計画が必要であり、研究プロジェクトに関わる人々は自分たちの仮説を支持することについて利害関係があることを覚えておいてください。もし、観察者がどの子供がどのグループにいるかを知っていたならば、手書きの文字が汚いときや、ちょっとした計算ミスなどの曖昧な回答をどのように解釈するかに影響を与えるかもしれません。どの子供がどのグループにいるかわからないようにすることによって、私たちはそのようなバイアスから守ることができます。この状況は一重盲検研究です。これは、一方のグループ(参加者)は自分がどちらのグループ(実験群または対照群)に属しているかを知らないが、実験を開発した研究者はどの参加者が各グループに属しているかを知っているということを意味します。

二重盲検研究では、研究者と参加者の両方がグループの割り当てを知ることができません。なぜ研究者は、どの人がどのグループに入っているかを誰も知らない状態で研究を行いたいと望むのでしょうか?それは、そうすることによって、私たちが実験者と参加者の両者の期待を統制することができるからです。もしあなたがプラシーボ効果という言葉をご存知であれば、なぜこれが重要な検討事項なのか、すでにある程度の考え方を身に着けていると思います。プラシーボ効果とは、人々の期待や信念が、ある状況下での経験に影響を与えたり決定したりするようなときに発生するものです。言い換えると、単純に何かが起こると期待するだけで、実際にその通りになるということです。

プラシーボ効果は、一般的には、新しい薬剤の効果をテストするという観点から説明されます。たとえば、あなたが製薬会社で働いていて、うつ病の治療に効果のある新薬を開発したと考えているところを想像してみてください。その薬が有効であることを証明するために、あなたは2つのグループで実験を行います:実験群には薬を投与し、対照群には薬を投与しません。しかし、あなたは、実験参加者には薬が投与されたかどうかを知られたくありません。

それはなぜでしょうか?あなたがこの研究の参加者で、気分を改善してくれると思っている錠剤を飲んだところだと想像してみてください。あなたはその錠剤が効果があるということを期待しているので、実際に錠剤に含まれる薬物のためではなく、単純に錠剤を飲んだというために気分が良くなるかもしれません。これがプラシーボ効果です。

気分への影響が期待によるものではなく薬によるものであることを確認するために、対照群にはプラシーボ(この場合は砂糖の錠剤)を渡します。これで全員が錠剤を手にしたことになり、研究者も実験参加者も、誰が薬を手にしたのか、誰が砂糖の錠剤を手にしたのかわからなくなります。実験群と対照群の間での気分の違いは、実験者バイアスや参加者の期待ではなく、薬そのものに帰することができるようになります(図2.16)。

図2.16 | 対照群にプラシーボ治療を行うことで、期待によって引き起こされるバイアスを防ぎます。(credit: Elaine and Arthur Shapiro)

独立変数と従属変数

研究実験では、私たちはあるものの変化が別のものの変化を引き起こすかどうかを調べようとします。これを達成するためには、私たちはいかなる実験研究においても、独立変数と従属変数という2つの重要な変数、つまり変化させることができるものに注目しなければなりません。独立変数とは、実験者によって操作または制御されるものです。うまく設計された実験研究では、独立変数は実験群と対照群の間の唯一の重要な違いとなります。教室でのテクノロジーの使用が学習にどのような影響を与えるかという私たちの例では、独立変数は研究参加者の学習の種類です(図2.17)。従属変数とは、独立変数がどの程度の影響を与えたかを見るために研究者が測定するものです。私たちの例では、従属変数は、参加者が提示した学習結果です。

図2.17 | 実験では、独立変数を操作することで、従属変数が変化することが期待されます。(credit: “classroom” modification of work by Nikolay Georgiev/Pixabay; credit “note taking”: modification of work by KF/Wikimedia)

私たちは、従属変数が独立変数の関数として変化することを期待しています。言い換えれば、従属変数は独立変数に依存しています。独立変数と従属変数の間の関係を考える良い方法は、この質問によるものです:「独立変数は従属変数にどのような影響を与えるだろうか?」先ほどの例に戻ると、コンピュータプログラムで授業を受けるのと、対面で講師から授業を受けるのとでは、どのような効果があるのでしょうか?

実験参加者の選択と割り当て

研究の設計ができたところで、私たちは実験に参加する個人の標本を得る必要があります。私たちの研究は人間の参加者が関与するものであるので、誰を参加させるかを決める必要があります。参加者とは、心理学的研究の対象者のことであり、その名の示す通り、心理学的研究に関与する人は、そのプロセスに積極的に参加することになります。心理学研究プロジェクトでは、大学生が参加者となることがよくあります。実際、心理学の下位分野における研究の大部分は、歴史的に学生を研究参加者として参加させてきました(Sears, 1986; Arnett, 2008)。しかし、大学生は本当に一般的な人口集団を代表しているのでしょうか?大学生は、一般人口に比べて若く、より教育を受けており、よりリベラルであり、多様性に欠ける傾向があります。学生をテストの被験者にすることは受け入れられている実践ですが、このような限られた研究参加者の一群に頼ることは、結果をより大きな集団に一般化することが難しいため、問題になる可能性があります。

私たちの仮想の実験は高校生を対象としたものであり、私たちはまず学生の標本を作成しなければなりません。標本を使用するのは、通常、母集団が大きすぎて、特定の実験にすべてのメンバーを合理的に参加させることができないからです(図2.18)。もし可能であるならば、私たちは無作為抽出の標本を使用するべきです(他の種類の標本もありますが、この章の目的のために、私たちは無作為抽出の標本に焦点を当てます)。無作為標本とは、より大きな母集団の一部であり、その母集団のすべてのメンバーが等しく選び出される確率を持つものです。無作為標本が好まれる理由は、もし標本が十分に大きければ、参加した個人がより大きな母集団を代表していることが合理的に確信できるからです。これは、標本に含まれる特徴(性別、民族性、社会経済的水準、その他結果に影響を与える可能性のある特徴)の割合が、より大きな母集団の割合に近いことを意味しています。

私たちの例では、関心のある母集団を代数学の学生と決めたとしましょう。しかし、全ての代数学の学生は非常に大きな集団であるので、私たちはもっと具体的にする必要があります。その代わりに、私たちの関心のある母集団を特定の都市の全ての代数学の学生とします。私たちは、さまざまな所得層、家庭環境、人種、民族性、宗教、および町の地理的区域の学生を含めるべきです。このようにより管理しやすい母集団があれば、私たちは地元の学校と協力して、実験に参加してもらいたい200人程度の代数学の学生の無作為標本を抽出することができます。

要約すると、私たちはある都市のすべての代数学の学生をテストすることはできないので、その都市の構成を反映した約200人のグループを見つけたいということです。代表するようなグループがあれば、私たちは標本に何らかの偏りがあるのではないかと心配することなく、調査結果をより大きな集団に一般化することができます。

図2.18 | 研究者は、(a)大きな母集団、または(b)大きな母集団の一部である標本グループを扱うことができます。(credit “crowd”: modification of work by James Cridland; credit “students”: modification of work by Laurie Sullivan)

これで私たちは標本が得られましたので、実験プロセスの次の段階は、参加者を無作為割り当てによって実験群と対照群に分けることです。無作為割り当てでは、すべての参加者は、どちらのグループに振り分けられるかの確率が等しくなります。標本の代数学の学生を実験群と対照群のどちらかに無作為に割り当てるような統計ソフトウェアがあります。

無作為割り当ては、健全な実験設計に不可欠なものです。十分に大きな標本では、無作為割り当てによって、グループ間に系統的な違いがでる可能性を低くすることができます。たとえば、男性だけで構成されたグループ、特定の民族的アイデンティティーを持つグループ、特定の宗教的イデオロギーを持つグループが存在する可能性は非常に低くなるでしょう。これは重要なことです。なぜなら、もし実験開始前の時点でグループが系統的に異なっていたとしたら、グループ間に見られる違いの起源がわからなくなってしまいます:「この差は元々あったものなのだろうか、それとも独立変数の操作によって生じたものなのだろうか?」無作為割り当てによって、私たちは、実験群と対照群の間で観察された差が独立変数の操作によるものであると仮定することができます。

学習へのリンク

このオンライン乱数発生器(http://openstax.org/l/rannumbers)を使用して、標本の無作為抽出と割り当てについて詳しく学んでください。

考慮すべき問題

実験によって科学者は因果関係を主張することができるようになりますが、問題がないわけではありません。本当の実験では、実験者が独立変数を操作する必要があり、それは心理学者が解決したい多くの問題を複雑にしてしまうことがあります。たとえば、あなたは性別(独立変数)が空間記憶(従属変数)にどのような影響を与えるかを知りたいと望んでいるとします。あなたは確かに空間記憶を活用した課題で男性と女性の違いを調べることはできますが、人の性別を直接統制することはできません。私たちはこのような研究アプローチを準実験的なものと分類し、このような状況では因果関係を主張できないことを認識しています。

また、実験者は倫理的な制約によっても制限されます。たとえば、あなたは、子供の頃に虐待を受けたことが、大人になってからの自尊心の低下につながるかどうかを調べるように設計された実験を行うことはできないでしょう。そのような実験を行うためには、あなたは実験参加者の一部を虐待を受けるグループに無作為に割り当てる必要がありますが、そのような実験は非倫理的です。

実験結果を解釈する

実験群と対照群の両方からデータを収集したら、2つのグループの間に意味のある違いがあるかどうかを調べるために、統計分析を行います。統計分析では、発見された差が偶然によるものである可能性(したがって、意味のないものである可能性)がどの程度であるかを判断します。たとえば、もしある栄養補助サプリメントの効果について実験を行い、プラシーボ錠剤(栄養補助サプリメントではない)を飲んだ人が、栄養補助サプリメントを飲んだ人と同じ結果になった場合、その実験は栄養補助サプリメントに効果がないことを示したことになります。一般に、心理学者は、グループ間で実際には差がない場合にその差が観察されてしまう可能性が5%未満であれば、統計的に有意な差であると考えます。別の言い方をすれば、心理学者は、「偽陽性」の主張をする可能性を5%以下に抑えたいと望んでいます。

実験の最大の強みは、結果における有意な差が独立変数に起因すると主張できることです。これは、無作為抽出、無作為割り当て、および実験者のバイアスと参加者の期待の両方の影響を制限する設計により、構成と取り扱いが類似したグループを作ることができるために起こることです。したがって、グループ間の差は独立変数に起因するものであり、これでようやく私たちは因果関係についての言明を行うことができます。もし暴力的なテレビ番組を見た結果、暴力的でない番組を見た場合よりも暴力的な行動が増えることがわかれば、私たちは、暴力的なテレビ番組を見ることによって、暴力的な行動の露呈の増加が引き起こされると問題なく言えるでしょう。

研究を報告する

心理学者は、研究プロジェクトを完了すると、一般的にその結果を他の科学者と共有したいと望みます。アメリカ心理学会(APA)は、科学誌に投稿するための論文の書き方を詳しく説明したマニュアルを発行しています。心理学に関心のある一般の読者を対象とした「サイコロジー・トゥデイ(Psychology Today)」のような雑誌に掲載される記事とは異なり、科学誌は一般的に、自ら積極的に研究を行っている専門家や学者という読者を対象とした査読付きの論文を掲載しています。

学習へのリンク

パデュー大学のオンライン・ライティング・ラボ(OWL)(http://openstax.org/l/owl)では、APA執筆ガイドラインを解説しています。

査読付き論文は、その主題の専門家である複数の科学者(通常は匿名)によって読まれます。これらの査読者は、著者とジャーナル編集者の両方に対して、草稿の質に関するフィードバックを提供します。査読者は、記述されている研究についての強力な根拠、研究の実施方法の明確な記述、および研究が倫理的な態様で実施された証拠を探します。彼らはまた、研究のデザイン、方法、統計分析に不備がないかどうかも確認します。また、研究中に得られた観察結果から著者が導き出した結論が妥当であるかどうかもチェックします。査読者はまた、その研究がその学問分野の知識を増進させる上でどれだけ価値があるかについてもコメントします。これにより、科学文献における研究結果の不必要な重複を防ぎ、それぞれの研究論文が新しい情報を提供することをある程度保証することができます。最終的には、ジャーナル編集者が査読者からのフィードバックをすべてまとめ、論文が現状のまま出版されるか(まれな出来事)、修正を加えて出版されるか、あるいは出版が認められないかを決定します。

査読は、心理学研究にある程度の品質管理をもたらします。発想や遂行が不十分な研究は淘汰されますし、うまく設計された研究であっても、提案された修正によって改善することができます。また、査読では、他の科学者が再現できるように、つまり彼らが異なる標本を用いて実験を繰り返して信頼性を確認することができるように、研究内容が十分明確に記述されているかどうかも確認されます。再現では、元の発見をさらに拡張するような追加の測定を行うこともあります。いずれにしても、それぞれの再現では、元の研究結果を裏付けるより多くの証拠を提供します。出版された研究の再現が成功すれば、科学者はその研究結果をより受け入れる傾向になりますが、再現の失敗が繰り返されれば、元の論文の正当性に疑いが投げかけられ、科学者は別の場所に目を向けるようになります。たとえば、ある新薬を服用すると、個人はその食生活を変えなくても健康的な体重を達成できるということを示す研究結果が発表されれば、医学分野では大きな進歩となるでしょう。しかし、他の科学者がその結果を再現できなければ、元の研究の主張は疑問視されるでしょう。

近年、心理学を含む多くの科学分野に対して影響を与えている「再現性の危機」についての懸念が増しています。一部の最も有名な研究や科学者は、他の人が再現できないような研究を生み出しています(Shrout & Rodgers, 2018で議論されているように)。実際、ノーベル賞を受賞した有名な科学者でさえ、彼女の結果を再現することが困難であったため、発表した論文を最近になって撤回しています(ノーベル賞を受賞した科学者のフランシス・アーノルドは、2020年1月3日に論文を撤回しています)。このような結果を受けて、一部の科学者は協力してよりオープンな形での活動を始めています。また、現在の「危機」は実際には科学が行われる方法やその結果を他者と共有する方法を改善していると主張する人もいます(Aschwanden, 2018)。

深く掘り下げてみよう

ワクチン-自閉症の神話と出版された研究の撤回

一部の科学者は、定期的に接種される小児用ワクチンが一部の子供に自閉症を発症させると主張しており、実際、いくつかの査読付き出版物がこのような主張をする研究を発表しました。しかし、当初の報告以降の大規模な疫学研究では、ワクチン接種が自閉症を引き起こす原因ではないこと、また、子供がワクチンを接種しないよりも接種した方がはるかに安全であることが示唆されています。さらに、そのような主張をしていた元の研究のいくつかは、その後に撤回されています。

出版された論文は、改竄や捏造、あるいは研究設計上の重大な問題のためにデータが疑問視された場合、取り消されることがあります。取り消されると、科学界は元の出版物に深刻な問題があることを知ることになります。撤回は、研究を主導した研究者、共同研究者、研究者を雇用した機関、または元々論文を掲載したジャーナルの編集委員会によって開始されます。ワクチン-自閉症の事例では、主導した研究者が小児用ワクチンと自閉症との関連性を確立することで金銭的な利益を得ていたという重大な利益相反があったため、撤回が行われました(Offit, 2008)。残念なことに、最初の研究があまりにも大きなメディアの注目を集めたため、世界中の多くの親が自分の子供にワクチンを接種することをためらうようになりました(図2.19)。このように誤りであることが露呈した研究に依存し続けることは、重大な結果をもたらしています。たとえば、2019年の1月から10月の間に、米国内で22件の麻疹のアウトブレイクが発生し、1000人以上の個人が麻疹に罹患しました(Patel et al., 2019)。これは、誤りであることが露呈した研究から立ち上がった反ワクチン運動が原因であると考えられます。ワクチンと自閉症の話がどのように展開されたか、またその話の反響についてのより多くの情報については、ポール・オフィットの著書『自閉症の偽預言者たち:悪い科学、危険な医学、そして治療法を求めて』をご覧ください。

図2.19 | いまだにワクチン接種が自閉症の原因と考える人がいます。(credit: modification of work by UNICEF Sverige)

信頼性と妥当性

信頼性と妥当性は、どのような種類のデータ収集においても考慮しなければならない2つの重要な点です。信頼性とは、ある結果を一貫して得られる能力のことを指します。心理学研究の文脈においては、データを収集するための手段や道具が、一貫して再現可能な方法でデータを収集していることを意味します。信頼性にはいくつかの異なる種類があります。それらには、評価者間信頼性(2人かそれ以上の異なる観察者が、観察された内容に関して一致する度合い)、内部一貫性(同じものを測定する調査の異なる項目が、互いに相関する度合い)、および試験-再試験信頼性(特定の測定結果が、複数回の実施にわたって一貫している度合い)などが含まれます。

残念ながら、測定方法が一貫しているからといって、必ずしも何かが正しく測定できているとは限りません。この概念を例示するために、あなたが朝に食べるシリアルの重さを測るために使われるキッチンの秤を考えてみましょう。秤の校正が適切に行われていないと、測定されるシリアルの量を常に過小評価したり、過大評価したりしてしまうでしょう。その秤は一貫した結果を出すという点では非常に信頼性が高いのですが(たとえば、同じ量のシリアルを秤に注ぐと、毎回同じ値が得られます)、その結果は正しくありません。ここで問題になるのが妥当性です。妥当性とは、ある手段や道具が、測定しようとしているものをどの程度正確に測定しているかということを指します。ここでもやはり、妥当性を表現する方法がいくつかあります。生態学的妥当性(研究結果を現実世界の応用に一般化できる度合い)、構成概念妥当性(ある変数が、測定しようと意図しているものを実際に捉えて、測定している度合い)、および表面的妥当性(ある変数が表面上は妥当に見える度合い)は、研究者が考慮するほんのいくつかのタイプに過ぎません。妥当であるような測定はどれも必然的に信頼できるものですが、その逆は必ずしも真ではありません。研究者は、高い信頼性と妥当性の両方を備えた手段を使用するように努めています。

日常へのつながり

SATとACTはどれだけ妥当でしょうか?

SATやACTのような標準化されたテストは、ある個人の大学教育への適性を測るものとされていますが、このようなテストの信頼性や妥当性はどの程度なのでしょうか?カレッジボードが行った研究によると、SATの点数は、大学1年生のGPAに対して高い予測妥当性を持つことが示唆されています(Kobrin, Patterson, Shaw, Mattern, & Barbuti, 2008)。この文脈においては、予測妥当性とは、テストが大学1年生のGPAを効果的に予測する能力のことを指します。多くの高等教育機関が入学選考時にSATやACTを要求していることを考えると、この高い予測妥当性は納得のいくことかもしれません。

しかしながら、大学入試においてSATやACTの点数が重視されることは、いくつかの面で議論を呼んでいます。まず、一部の研究者は、これらのテストには偏りがあり、少数派の学生を不利な立場に置き、大学に入学できる可能性を不当に低下させていると主張しています(Santelices & Wilson, 2010)。さらに、ある研究は、これらのテストの予測妥当性が、大学1年生のGPAをどれだけうまく予測できるかという点について、極端に誇張されているということを示唆しています。実際、SATの予測妥当性は最大で150%も過大評価されている可能性があると指摘されています(Rothstein, 2004)。多くの高等教育機関では、入学審査においてSATの点数を重視しないことを検討し始めています(Rimer, 2008)。

最近、国内外での目立った不正行為のスキャンダルがあったことで、この種のテストに注がれる視線はますます厳しくなっており、2019年3月現在、1000を超える高等教育機関が、入学試験におけるSATやACTのテストの要件を緩和または廃止しています(Strauss, 2019, March 19)。

2.4 倫理

学習目標

この節が終わるまでに、あなたは次のことができるようになります:

  • 人間の対象者が関与する研究がどのように規制されているかを議論する
  • インフォームド・コンセントとデブリーフィングのプロセスを要約する
  • 動物の対象者が関与する研究がどのように規制されているかを説明する

今日、科学者たちは、優れた研究は本質において倫理的であり、人間の尊厳と安全を基本的に尊重することによって導かれるものであることに同意しています。しかしながら、あなたが以下の囲み記事で読むことになるように、これは必ずしもそうであったというわけではありませんでした。現代の研究者は、自らが行う研究が倫理的に健全であることを証明しなければなりません。この節では、倫理的配慮が、今日行われる研究の設計と実施にどのように影響するかを紹介します。

人間の参加者が関与する研究

人間の対象者の参加を伴う実験には、その実験が有害な結果を招かないようにするために設計された広範かつ厳格なガイドラインが適用されます。人間の参加者を伴う研究について連邦政府の支援を受ける研究機関は、機関内審査委員会(IRB)を利用しなければなりません。IRBは、しばしば研究機関の管理者、科学者、地域住民などのメンバーで構成される個人からなる委員会です(図2.20)。IRBの目的は、人間の参加者が関与する研究の提案を審査することです。IRBは、上記の原則を念頭に置いてこれらの提案を審査し、一般的には、実験を進めるためにはIRBの承認が必要とされます。

図2.20 | ある機関のIRBは、定期的に会合を開き、人間の参加者が関与する実験の提案を審査します。(credit: International Hydropower Association/Flickr)

ある機関のIRBは、実験を承認するに際して、いくつかの要素を求めます。そのうちのひとつは、実験に参加する前に、それぞれの参加者がインフォームド・コンセントの書面に署名していなければならないことです。インフォームド・コンセントの書面とは、研究の潜在的なリスクや研究の意味合いなどといった、参加者が実験中に予期することを文章で記述したものです。それはまた、実験への参加は完全に自発的なものであり、いつでも罰則なしにやめることができるということを参加者に伝えます。さらに、インフォームド・コンセントでは、実験で収集されたいかなるデータも完全に秘密にされることが保証されます。研究参加者が18歳未満の場合には、両親または法定後見人がインフォームド・コンセントの書面に署名することが求められます。

学習へのリンク

この同意の書面の例(http://openstax.org/l/consentform)を見て、さらに学んでください。

インフォームド・コンセントの書面は、参加者が何をするのかを正確に記述する上で可能な限り正直であるべきですが、参加者が正確な研究課題を知っていることが研究結果に影響を与えないようにするために、欺瞞が必要な場合もあります。欺瞞とは、実験の真正性を維持するために実験参加者を意図的に欺きますが、その欺瞞が有害であると考えられるほどではないようなものです。たとえば、ある人に対する評価がその人の服装によってどのような影響を受けるかについて私たちが興味を持っている場合、その知識が参加者の回答に影響を与えないようにするために、実験の説明に欺瞞を用いることがあります。欺瞞が関与した場合には、研究終了時に参加者は完全なデブリーフィング—実験の目的、収集されたデータの使用方法、欺瞞が必要だった理由、研究についての追加情報の入手方法などに関する完全で誠実な情報—を受けなければなりません。

深く掘り下げてみよう

倫理とタスキギー梅毒研究

残念ながら、今日の研究のために存在する倫理ガイドラインは、過去には必ずしも適用されていませんでした。1932年、アメリカ公衆衛生局が黒人男性の梅毒を研究する目的で行った実験に、アラバマ州タスキギーの貧しい農村の黒人男性小作人が参加するよう募集されました(図2.21)。600人の男性が、無料の医療、食事、埋葬保険と引き換えに、この研究に参加することに同意しました。半分強の男性が梅毒の陽性反応を示し、彼らは実験群となりました(研究者は参加者を無作為にグループに割り当てることができなかったことを踏まえると、これは準実験を表しています)。残りの梅毒のない人たちが対照群となりました。しかしながら、梅毒の陽性反応が出た人は、自分が梅毒に罹っていることを知らされませんでした。

研究開始時には梅毒の治療法はありませんでしたが、1947年までにはペニシリンが梅毒の有効な治療法として認められるようになりました。それにもかかわらず、この研究の参加者にはペニシリンは投与されず、彼らが研究を続ける場合には他の施設で治療を受けることは許されませんでした。40年の間に、多くの参加者は知らず知らずのうちに妻に梅毒をうつし(その結果として、その妻から生まれた子供にも梅毒をうつし)、最終的には梅毒の治療を受けることがなかったために亡くなっていきました。この研究は、1972年に全米の報道機関によって実験が発覚し、中止されました(Tuskegee University, n.d.)。この実験に対する怒りの声は、1974年の全米研究法や、この章で説明した人間を対象とした研究のための厳しい倫理ガイドラインへと直接つながっていきました。どのような理由からこの研究は非倫理的なのでしょうか?この研究の結果として、参加した男性とその家族はどのような被害を受けたでしょうか?

図2.21 | タスキギー梅毒研究の参加者が注射を受けています。

学習へのリンク

タスキギー梅毒研究についてのこのウェブサイト(http://openstax.org/l/tuskegee)を訪れて、さらに学んでください。

動物の対象者が関与する研究

心理学者の多くは、動物の対象者が関与する研究を行っています。しばしばこれらの研究者は、齧歯類(図2.22)や鳥類を実験の対象者として使用しています。APAは、心理学における動物の研究の90%はこれらの種を使っていると推定しています(American Psychological Association, n.d.)。動物における基本的なプロセスの多くは人間のものと十分に類似しているため、これらの動物は、人間の参加者では非倫理的であると見なされるであろう研究のための代用として受け入れられています。

図2.22 | この写真で示されているもののようなラットは、しばしば動物研究の対象となります。

これは、動物研究者が倫理的な問題と無縁ということを意味しません。実際、この種の研究では、動物研究の対象者を人道的かつ倫理的に扱うことが重要な側面となります。研究者は、研究の被験者となる動物が経験する痛みや苦痛を最小限に抑えるように実験を設計しなければなりません。

IRBが人間の参加者の関与する研究提案を審査するのに対し、動物実験の提案は機関内動物ケア・使用委員会(IACUC)で審査されます。IACUCは、機関の管理者、科学者、獣医師、地域住民などで構成されています。この委員会は、すべての実験提案が動物の研究対象者の人道的な扱いを必要とするのを確実にすることを責務としています。それはまた、研究プロトコルが守られていることを確認するために、すべての動物施設を半年ごとに監査します。この委員会の承認を得ずに動物研究プロジェクトを進めることはできません。

重要用語

アーカイブ研究:過去の記録やデータセットを用いて、さまざまな研究の質問に答えたり、興味深いパターンや関係性を調べたりする研究手法

離脱:時間の経過とともに研究から脱落する人がでるにつれて、研究参加者の数が減少すること

因果関係:ある変数の変化が他の変数の変化を引き起こすこと。実験的な研究の設計によってのみ決定される

臨床研究または事例研究:1人または数人に焦点を当てた観察研究

確証バイアス:考え方や信念を否定するような証拠を無視する傾向

交絡変数:関心のある変数の両方に影響を与える予期しない外部要因。実際にはその外部要因が両方の変数に変化を与えている場合であっても、一方の変数の変化が他方の変数の変化を引き起こしているという誤った印象をしばしば与える

対照群:比較の基準となり、研究結果に影響を与える可能性のある偶然の要因を統制するためのもの。そのような要因をグループ間で一定に保つことにより、実験的な操作がグループ間の唯一の違いとなる

相関:2つかそれ以上の変数の間の関係性。2つの変数が相関している場合、一方の変数が他方の変数の変化に応じて変化する

相関係数:変数間の関係の強さと方向性を示す-1から+1までの数値で、通常はrで表される

横断的研究:同じ時間における母集団の複数の部分を比較する

デブリーフィング:実験に欺瞞が関与した場合、実験終了時に参加者に実験についての完全かつ真実の情報を伝えること

欺瞞:実験の真正性を維持するために、実験参加者を意図的に欺くこと

演繹的推論:一般的な前提に基づいて結果を予測すること

従属変数:独立変数がどの程度の影響を与えたかを見るために研究者が測定する変数

二重盲検研究:研究者と参加者の両方がグループの割り当てを知ることができない実験

経験主義的:誰が観察しているかにかかわらず、何度も何度も観察することのできる客観的で具体的な証拠に基づくこと

実験群:研究の質問に答えるように設計されたグループ。実験的操作が実験群と対照群の間の唯一の違いであるため、両者の間の違いは偶然ではなく実験的操作によるものである

実験者バイアス:研究者の予想が研究結果を歪めること

事実:経験主義的研究を通じて収集された証拠を用いて確立された、客観的で検証可能な観察

反証可能:実験結果によって反証されることが可能であること

一般化:ある標本についての結果がより大きな母集団に当てはまると推測すること

仮説:2つかそれ以上の変数の間の関係性についての暫定的で検証可能な記述

錯誤相関:実際にはそのような関係が存在しないのに、2つのものの間に関係性を見出すこと

独立変数:実験者によって影響を受けたり制御されたりする変数。健全な実験研究では、独立変数が実験群と対照群の間の唯一の重要な違いとなる

帰納的推論:観察から結論を導き出すこと

インフォームド・コンセント:実験中に予想されること、関連するリスク、および研究の意味合いについて研究参加者に情報を提供し、その人から参加の同意を得るプロセス

機関内動物ケア・使用委員会(IACUC):管理者、科学者、獣医師、地域住民からなる委員会で、人間以外の動物が関与する研究の提案を審査する

機関内審査委員会(IRB):管理者、科学者、地域住民からなる委員会で、人間の参加者が関与する研究の提案を審査する

評価者間信頼性:特定の事象をどのように記録し分類するかについての観察者間での一致の尺度

縦断的研究:同じグループの個人を長期間にわたって繰り返し調査または測定する研究

自然主義的観察:自然な状況における行動の観察

負の相関:2つの変数が異なる方向に変化し、一方の変数が大きくなると他方の変数が小さくなること。負の相関は相関がないこととは異なる

観察者バイアス:観察者の期待に沿うように観察が歪められてしまうこと

操作的定義:従属変数を測定し、独立変数を操作するために、どのような行動や操作を行うかについての記述

意見:個人的な判断、結論、または態度であり、正確であるかもしれないし、正確でないかもしれない

参加者:心理学的研究の対象者

査読付きの論文:その主題の専門家である複数の科学者(通常は匿名)に読まれ、出版が認められる前に原稿の質に関するフィードバックを受ける論文

プラシーボ効果:人々の期待や信念が、ある状況下での経験に影響を与えたり決定したりすること

母集団:研究者が興味を持っている個人の全体的なグループ

正の相関:2つの変数が同じ方向に変化し、両者が一緒に大きくなったり小さくなったりすること

無作為割り当て:すべての参加者が、どちらかのグループに振り分けられる確率が等しいような実験グループの割り当て方法

無作為標本:より大きな母集団の一部であり、その母集団のすべてのメンバーが等しく選び出される確率を持つもの

信頼性:ある結果の一貫性と再現性

再現:研究の信頼性を確認するために、異なる標本を用いて実験を繰り返すこと

標本:より大きな母集団から選ばれた個人の小集団

一重盲検研究:どの参加者が実験群に含まれており、どの参加者が対照群に含まれているかを研究者が知っている実験

統計分析:実験のグループ間の差が偶然によるものである可能性がどの程度であるかを判断すること

調査(サーベイ):研究者が多数の人々からデータを収集することができるように、紙に鉛筆で書き込む質問票、電子的に実施される質問、または口頭で行われる、研究参加者が答えるべき質問のリスト

理論:観察された現象の説明を提案するような、よく練られた一連のアイデア

妥当性:測定するために設計されたものを測定する際における結果の正確さ

この章のまとめ

2.1 なぜ研究が重要なのでしょうか?

科学者は、自分を取り巻く世界がどのように機能しているかを説明し、理解することに従事しています。彼らは、検証可能かつ反証可能な仮説を生み出す理論を打ち立てることによって、それを行うことができます。検証に耐えられる理論は維持され、改良される一方で、そうでない理論は破棄されたり修正されたりします。このように、研究によって科学者は事実と単なる意見とを分離することができます。研究によって生み出された優れた情報を手にすることは、公共政策においても私たちの個人的な生活においても賢明な意思決定を行う助けとなります。

2.2 研究へのアプローチ

臨床研究や事例研究では、ほんの数人の個人を長期間にわたって研究します。このアプローチでは、非常に深い情報を得ることができますが、これらの観察をより多くの人々に一般化する能力には問題があります。自然主義的観察では、自然な状況での行動を観察し、現実的な状況から妥当で真に迫った情報を収集することができます。しかしながら、自然主義的観察では、あまり統制をすることができず、しばしば実行するためにかなりの時間と費用を必要とします。研究者は、データを収集するための道具が、信頼できるものであり(一貫しており再現可能なものであり)、妥当なものである(正確なものである)ことを確実にするよう努めています。

調査(サーベイ)はさまざまな方法で実施することができ、大量のデータを素早く収集することができます。しかしながら、調査で収集できる情報の深さは、臨床研究や事例研究に比べてやや限られています。

アーカイブ研究は、研究の質問に答えるために既存のデータセットを調査するものです。

縦断的研究は、人々が時間の経過とともにどのように変化するかについてデータを収集する必要がある研究者にとって、非常に有用です。横断的研究は、同じ時間における母集団の複数の部分を比較します。

2.3 成果の分析

相関は、-1~1の範囲の相関係数rで表されます。相関係数は、2つかそれ以上の変数間の関係の性質(正または負)とその強さを私たちに教えてくれます。相関は、変数間の関係の強さにかかわらず、因果関係については私たちに何も教えてくれません。実際、因果関係を示すための唯一の方法は、実験を行うことによるものです。人々はしばしば、実際には相関がないのに相関があると主張するという間違いを犯します。

研究者は、実験を行うことによって因果関係の仮説を検証することができます。理想的には、実験参加者は対象となる母集団から無作為に選ばれます。そして、参加者はそれぞれのグループに無作為に割り当てられます。時には、研究者と実験参加者の期待が結果に影響するのを防ぐために、グループのメンバーについて研究者と参加者には分からないようにすることもあります。

理想的な実験設計では、実験群と対照群の唯一の違いは、参加者が実験の操作にさらされるかどうかです。それぞれのグループは実験のすべての段階を経由しますが、それぞれのグループは異なるレベルの独立変数を経験します:実験群は実験の操作にさらされ、対照群は実験の操作にさらされません。そして、研究者は、それぞれのグループの従属変数に生じた変化を測定します。両グループからデータを収集したら、それを統計的に分析し、グループ間に意味のある差が存在するかどうかを判断します。

心理学者は、研究の知見を査読付きの論文で報告します。この形式で発表された研究は、他の複数の心理学者によってチェックされます。その人たちは、証拠によって裏付けられたアイデアとそうでないアイデアを分けるフィルターの役割を果たします。再現性は、出版された研究の正当性を確保する上で重要な役割を有しています。長期的には、一貫して再現可能な研究結果のみが、科学界のコンセンサスを得ることができます。

2.4 倫理

研究における倫理は進展しつつある分野であり、過去には受け入れられていた、あるいは許容されていた行為であっても、今日では非倫理的と見なされることがあります。研究者は、人間の参加者が関与する実験を行う際には、基本的な倫理指針を遵守することが期待されています。人間の参加者が関与するいかなる実験も、IRBの承認を得なければなりません。実験への参加は自発的なものであり、参加者のインフォームド・コンセントが必要です。実験に欺瞞があった場合は、研究終了時にそれぞれの参加者に十分なデブリーフィングを行わなければなりません。

動物研究でも高い倫理基準が固守されます。動物を実験対象として使用する研究者は、痛みや苦痛が最小限になるようにプロジェクトを設計しなければなりません。動物研究にはIACUCの承認が必要であり、すべての動物施設は、動物が人道的に扱われているかどうかを確認するために、定期的な監査を受けます。

レビュー問題

1.科学的仮説とは、________であり、反証可能なものです。
a.観察可能
b.独創的
c.証明可能
d.検証可能

2.________は、観察可能な現実として定義されています。
a.行動
b.事実
c.意見
d.理論

3.科学的知識は、________なものです。
a.直感的
b.経験主義的
c.永続的
d.主観的

4.フロイトの初期の理論に対する主要な批判は、彼の理論が________という事実が関係しています。
a.あまりにも範囲が狭すぎた
b.あまりにも理不尽なものだった
c.あまりにも範囲が広すぎた
d.検証可能ではなかった

5.ジークムント・フロイトは、数人のクライエントに長期間にわたって綿密なインタビューを行うことによって、人間の人格についての理論を発展させました。このタイプの研究アプローチは、________として知られています。
a.アーカイブ研究
b.事例研究
c.自然主義的観察
d.調査(サーベイ)

6.________には、自然な環境における個人の行動を観察することが含まれます。
a.アーカイブ研究
b.事例研究
c.自然主義的観察
d.調査(サーベイ)

7.事例研究の主たる限界は、________です。
a.このアプローチで収集される情報の性質が表面的であること
b.このアプローチでは研究者がコントロールを有さないこと
c.このアプローチで得られた知見をより大きな集団に一般化できないこと
d.評価者間信頼性が欠如していること

8.自然主義的観察の研究の利点は、________です。
a.現実的な状況で収集されるデータの真正性
b.これらの研究が迅速かつ容易に実行できること
c.データができるだけ効率的に収集されるようにする研究者の能力
d.この特定のアプローチで因果関係を決定する能力

9.研究の質問に答えるために既存の記録を使用することは、________として知られています。
a.自然主義的観察
b.調査(サーベイ)研究
c.縦断的研究
d.アーカイブ研究

10.________には、研究参加者のグループを長期間にわたって追跡することが含まれます。
a.アーカイブ研究
b.縦断的研究
c.自然主義的観察
d.横断的研究

11.________は、研究者によって作成された質問のリストであり、紙媒体で実施することができます。
a.アーカイブ
b.事例研究
c.自然主義的観察
d.調査(サーベイ)

12.縦断的研究は、高い割合の________によって複雑になります。
a.欺瞞
b.観察
c.離脱
d.一般化

13.身長と体重は正の相関があります。これは次のことを意味します:
a.身長と体重の間には関係性がない。
b.通常、身長が高い人ほど、痩せている。
c.通常、身長が低い人ほど、体重が重い。
d.身長が高くなると、典型的には体重が増える。

14.以下の相関係数のうち、2つの変数の間に最も強い関係があることを示すものはどれですか?
a.–0.90
b.–0.50
c.+0.80
d.+0.25

15.試験の前の週にテレビを見ていた時間数とその試験の成績との間に負の相関があることを最もよく表しているのはどの文章でしょうか?
a.テレビの見過ぎは、試験の成績低下につながる。
b.賢い生徒はテレビをあまり見ない。
c.テレビを見ることは、学生が次の試験の準備をするのを妨害する。
d.テレビをより多く見る学生は、試験の成績がより悪くなる。

16.相関係数は、________ときに、最も弱い関係を示します。
a.0に最も近い
b.-1に最も近い
c.正である
d.負である

17.________とは、母集団のすべての人が調査への参加を求められる可能性が同じであることを意味します。
a.操作
b.プラシーボ効果
c.無作為割り当て
d.無作為標本

18.(1)________は実験者によって統制されますが、(2)________は実験者によって収集され統計的に分析される情報を表しています。
a.(1)従属変数、(2)独立変数
b.(1)独立変数、(2)従属変数
c.(1)プラシーボ効果、(2)実験者バイアス
d.(1)実験バイアス、(2)プラシーボ効果

19.研究者は、自身の研究における重要な概念を、その概念がどのように定義されたかを他の人が明確に理解できるように、________しなければなりません。
a.無作為割り当て
b.無作為に選択
c.操作
d.一般化

20.時には、研究者は参加者の期待が実験に与える影響をコントロールするために、対照群の参加者に________を投与します。
a.従属変数
b.独立変数
c.統計分析
d.プラシーボ

21.(1)________は動物の研究のためのものであり、(2)________は人間の研究のためのものです。
a.(1)インフォームド・コンセント、(2)欺瞞
b.(1)IACUC、(2)IRB
c.(1)IRB、(2)IACUC
d.(1)欺瞞、(2)デブリーフィング

22.研究者は、実験の全ての詳細を参加者に提供すると回答が歪む可能性がある場合、________を使用することがあります。
a.インフォームド・コンセント
b.欺瞞
c.倫理
d.デブリーフィング

23.ある人が研究プロジェクトへ参加することは、________でなければなりません。
a.無作為
b.報酬付き
c.自発的
d.公開

24.実験に参加する前に、個人は________の書面を読み、署名するべきです。
a.インフォームド・コンセント
b.デブリーフィング
c.IRB
d.倫理

批判的思考の問題

25.この章では、特定の学生集団におけるテクノロジーの使用について、複数の研究者が異なる結論を出していることが議論されました。ある研究では、外科の学生向けのスマートフォンアプリが効果的であると判断されましたが、別の研究では、学部生がテクノロジーを使用することで、睡眠、コミュニケーション、時間管理に悪影響があることが見出されました。このような矛盾に最もうまく対処するためには、教育指導者はどのようにすればよいでしょうか?

26.科学的方法は、しばしば自己修正的で循環的であると言われます。これらの概念に関連させて、あなたの科学的方法の理解を簡潔に述べてください。

27.この章では、結合双生児のクリスタとタチアナが、事例研究の潜在的な参加者候補として説明されました。他にどのような状況であれば、この特定の研究アプローチが特に役立つと思いますか?その理由は何ですか?

28.一見したところ、リアリティーテレビ番組は、そこに登場する人物が示す行動を現実的に描写することを目的としています。この章では、それが実際には当てはまらない理由を指摘しました。現実的な行動をより正直に描くためには、そのような番組の制作方法にどのような変更を加えることができるでしょうか?

29.糖尿病などの病気の有病率に対する食事と運動の影響を調べるには、この章で議論された研究方法のうち、どの方法が最も適しているでしょうか?その理由は何ですか?

30.生物医学研究以外で、縦断的研究とアーカイブ研究の両方から大きな恩恵を受けられる他の研究分野はありますか?

31.この章の最初の方で、私たちはシリアルを食べることと体重との間に相関があることを示唆する研究について読みました。この情報を広告に載せているシリアル会社は、シリアルをたくさん食べることが健康的な体重を引き起こすと誰かに信じさせることができます。彼らはなぜそのような主張をするのでしょうか?また、この因果関係の主張に対抗するために、あなたはどのような議論をすることができますか?

32.最近、「栄養摂取とがん(Nutrition and Cancer)」誌に、コーヒーの消費と乳がんの間に負の相関があることを示す研究が発表されました。具体的には、1日に5杯よりも多いコーヒーを摂取する女性は、コーヒーを全く飲まない女性に比べて乳がんになる可能性が低いことがわかりました(Lowcock, Cotterchio, Anderson, Boucher, & El-Sohemy, 2013)。この研究についての新聞記事に、「コーヒーはがんを防ぐ」と書かれていると想像してください。この見出しが誤解を招く理由は何でしょうか?また、より正確な見出しの方が興味を引かないであろう理由は何でしょうか?

33.時には、真の意味での無作為標本を得るのは非常に困難な場合があります。多くの研究者は、代わりに便宜的標本を利用しています。たとえば、1つのよくある便宜的標本は、心理学入門コースに登録している学生を対象としたものです。この標本手法を使用することの意味合いは何でしょうか?

34.査読は、多くの科学分野で研究成果を発表する際に重要な役割を果たします。このプロセスは通常、匿名で行われます。言い換えれば、査読される論文の著者は、誰がその論文を査読しているかを知らず、査読者は著者の身元を知りません。これが査読プロセスの重要な部分であるのはなぜでしょうか?

35.人間の参加者とは異なり、動物は研究に参加することに同意していないため、動物研究は倫理の観点から本質的な欠陥があると主張する人がいます。あなたはこの視点に賛成しますか?動物が研究プロジェクトに参加することに同意していないことを考えると、動物が可能な限り人道的な扱いを受けることを保証するために、どのような種類の特別な予防措置を取るべきでしょうか?

36.あなたは、興味のある何らかの質問に答えるための基本的な実験を設計するように求められました。あなたの実験を科学界の期待する倫理的研究に確実に適合させるためには、あなたの提案した研究にはどのような倫理的配慮がなされるべきですか?

個人的に当てはめてみる問題

37.医療専門家は、肥満に関連する膨大な数の健康問題を挙げています。また、多くの人が健康的な体重を達成したいという当然の願望を持っています。市場には体重を減らしたい人を助けるためのダイエットプログラムやサービス、商品がたくさんあります。もし親しい友人がこれらの商品やプログラム、サービスの購入や参加を検討しているとしたら、あなたはその友人に対して、その決定がもたらす潜在的な結果をどのようにして十分に理解してもらいますか?また、自分自身がそのような投資やライフスタイルの変更を行う前に、あなたならばどのような情報を確認したいと思いますか?

38.あなたの友人が、地元のペットショップでアルバイトをしています。あなたの友人は、犬が普段どのようにコミュニケーションをとっているのか、どのようにお互いに交流しているのかに興味を持つようになり、地元の動物病院を訪れて、待合室で犬がどのように交流しているかを見てみようと考えています。この章を読んだ上で、あなたはそのような交流をよりよく理解するには、この方法が最良だと思いますか?また、より妥当なデータを得るために何か提案はありますか?

39.あなたは、大学生として、課程を終えた際に得る成績を気にしていることでしょう。もしあなたが、全体的なGPAが大学卒業後の人生の成功にどのように関係しているかを知りたいとしたら、あなたはどのようにしてこの質問にアプローチすることを選び、その研究を行うためにどのような資源を必要とするでしょうか?

40.私たちは誰でも、時々、錯誤相関を作り出してしまう傾向があります。自分や家族、親しい友人が抱いている錯誤相関を考えてみてください。あなたは、その錯誤相関がどのようにして生まれたと思いますか?また、それらに対抗するために、今後どのようなことができるでしょうか?

41.あなたは、人間や動物の行動について、どうしても答えたい疑問がありますか?仮説を立て、あなたの疑問に答えるためにどのような実験を行うかを簡単に説明してください。

42.動物の対象者が関与する研究の成果として、私たちの社会が達成したすべての進歩について、数分間考えてみてください。あなたや友人、家族は、この種の研究から直接どのような恩恵を受けましたか?

参考文献

American Cancer Society. (n.d.). History of the cancer prevention studies. http://www.cancer.org/research/researchtopreventcancer/history-cancer-prevention-study

American Psychological Association. (2009). Publication Manual of the American Psychological Association (6th ed.). Author.

American Psychological Association. (n.d.). Research with animals in psychology. https://www.apa.org/research/responsible/research-animals.pdf

Arnett, J. (2008). The neglected 95%: Why American psychology needs to become less American. American Psychologist, 63(7), 602–614.

Aschwanden, C. (2018, December 6). Psychology’s replication crisis has made the field better. FiveThirtyEight. https://fivethirtyeight.com/features/psychologys-replication-crisis-has-made-the-field-better/

Barnett, W. S. (2011). Effectiveness of early educational intervention. Science, 333(6045), 975–978. https://science.sciencemag.org/content/333/6045/975

Barton, B. A., Eldridge, A. L., Thompson, D., Affenito, S. G., Striegel-Moore, R. H., Franko, D. L., . . . Crockett, S. J. (2005). The relationship of breakfast and cereal consumption to nutrient intake and body mass index: The national heart, lung, and blood institute growth and health study. Journal of the American Dietetic Association, 105(9), 1383–1389. http://dx.doi.org/10.1016/j.jada.2005.06.003

Blann, L.E. (2005). Early intervention for children and families: With special needs. MCN: The American Journal of Maternal Child Nursing, 30, 263–67.

Chwalisz, K., Diener, E., & Gallagher, D. (1988). Autonomic arousal feedback and emotional experience: Evidence from the spinal cord injured. Journal of Personality and Social Psychology, 54, 820–828.

Dominus, S. (2011, May 25). Could conjoined twins share a mind? New York Times Sunday Magazine. http://www.nytimes.com/2011/05/29/magazine/could-conjoined-twins-share-a-mind.html?_r=5&hp&

Egnor, M. (2017, November 24). What the craniopagus twins teach us about the mind and the brain. Evolution News & Science Today. https://evolutionnews.org/2017/11/what-the-craniopagus-twins-teach-us-about-the-mind-and-the-brain/

Ethnicity and Health in America Series: Featured Psychologists (n.d.). American Psychological Association. https://www.apa.org/pi/oema/resources/ethnicity-health/psychologists/sumner-prosser

Fanger, S. M., Frankel, L. A., & Hazen, N. (2012). Peer exclusion in preschool children’s play: Naturalistic observations in a playground setting. Merrill-Palmer Quarterly, 58, 224–254.

Fiedler, K. (2004). Illusory correlation. In R. F. Pohl (Ed.), Cognitive illusions: A handbook on fallacies and biases in thinking, judgment and memory (pp. 97–114). Psychology Press.

Frantzen, L. B., Treviño, R. P., Echon, R. M., Garcia-Dominic, O., & DiMarco, N. (2013). Association between frequency of ready-to-eat cereal consumption, nutrient intakes, and body mass index in fourth- to sixth-grade low-income minority children. Journal of the Academy of Nutrition and Dietetics, 113(4), 511–519.

Godoy, J. C., & Brussino, S. (2010). Psychology in Argentina. The Corsini Encyclopedia of Psychology. John Wiley & Sons.

Gunamudian David Boaz. (n.d.). World Library. http://www.worldlibrary.org/articles/Gunamudian_David_Boaz

Harper, J. (2013, July 5). Ice cream and crime: Where cold cuisine and hot disputes intersect. The Times-Picaune. http://www.nola.com/crime/index.ssf/2013/07/ice_cream_and_crime_where_hot.html

Jenkins, W. J., Ruppel, S. E., Kizer, J. B., Yehl, J. L., & Griffin, J. L. (2012). An examination of post 9-11 attitudes towards Arab Americans. North American Journal of Psychology, 14, 77–84.

Jones, J. M. (2013, May 13). Same-sex marriage support solidifies above 50% in U.S. Gallup Politics. http://www.gallup.com/poll/162398/sex-marriage-support-solidifies-above.aspx

Kobrin, J. L., Patterson, B. F., Shaw, E. J., Mattern, K. D., & Barbuti, S. M. (2008). Validity of the SAT for predicting first-year college grade point average (Research Report No. 2008-5). https://research.collegeboard.org/sites/default/files/publications/2012/7/researchreport-2008-5-validity-sat-predicting-first-year-college-grade-point-average.pdf

Lewin, T. (2014, March 5). A new SAT aims to realign with schoolwork. New York Times. http://www.nytimes.com/2014/03/06/education/major-changes-in-sat-announced-by-college-board.html.

Lowcock, E. C., Cotterchio, M., Anderson, L. N., Boucher, B. A., & El-Sohemy, A. (2013). High coffee intake, but not caffeine, is associated with reduced estrogen receptor negative and postmenopausal breast cancer risk with no effect modification by CYP1A2 genotype. Nutrition and Cancer, 65(3), 398–409. doi:10.1080/01635581.2013.768348

Lowry, M., Dean, K., & Manders, K. (2010). The link between sleep quantity and academic performance for the college student. Sentience: The University of Minnesota Undergraduate Journal of Psychology, 3(Spring), 16–19. http://www.psych.umn.edu/sentience/files/SENTIENCE_Vol3.pdf

Margaret Floy Washburn, PhD. (n.d.). American Psychological Association. https://www.apa.org/about/governance/president/bio-margaret-washburn.

Mary Whiton Calkins. (n.d.). American Psychological Association. https://www.apa.org/about/governance/president/bio-mary-whiton-calkins

Massimini, M., & Peterson, M. (2009). Information and communication technology: Affects of U.S. college students. Cyberpsychology: Journal of Psychosocial Research on Cyberspace, 3(1).

McKie, R. (2010, June 26). Chimps with everything: Jane Goodall’s 50 years in the jungle. The Guardian. http://www.theguardian.com/science/2010/jun/27/jane-goodall-chimps-africa-interview

Narendra Nath Sen Gupta. (n.d.). Veethi: The face of India. https://www.veethi.com/india-people/narendra_nath_sen_gupta-profile-4893-16.htm

Neil, A. L., & Christensen, H. (2009). Efficacy and effectiveness of school-based prevention and early intervention programs for anxiety. Clinical Psychology Review, 29, 208–15.

Nobel Prize-winning scientist Frances Arnold retracts paper. (2020, January 3). BBC News. https://www.bbc.com/news/world-us-canada-50989423

Offit, P. (2008). Autism’s false prophets: Bad science, risky medicine, and the search for a cure. Columbia University Press.

Patel, M., Lee, A. D., Clemmons, N. S., Redd, S. B., Poser, S., Blog, D., …Gastañaduy, P. A. (2019, October 11). National update on measles cases and outbreaks—United States, January 1–October 1, 2019. Morbidity and Mortality Weekly Report, 68, 893–96.

Perkins, H. W., Haines, M. P., & Rice, R. (2005). Misperceiving the college drinking norm and related problems: A nationwide study of exposure to prevention information, perceived norms and student alcohol misuse. J. Stud. Alcohol, 66(4), 470–478.

Peters-Scheffer, N., Didden, R., Korzilius, H., & Sturmey, P. (2011). A meta-analytic study on the effectiveness of comprehensive ABA-based early intervention programs for children with Autism Spectrum Disorders. Research in Autism Spectrum Disorders, 5, 60–69.

Rimer, S. (2008, September 21). College panel calls for less focus on SATs. The New York Times. http://www.nytimes.com/2008/09/22/education/22admissions.html?_r=0

Rothstein, J. M. (2004). College performance predictions and the SAT. Journal of Econometrics, 121, 297–317.

Rotton, J., & Kelly, I. W. (1985). Much ado about the full moon: A meta-analysis of lunar-lunacy research. Psychological Bulletin, 97(2), 286–306. doi:10.1037/0033-2909.97.2.286

Santelices, M. V., & Wilson, M. (2010). Unfair treatment? The case of Freedle, the SAT, and the standardization approach to differential item functioning. Harvard Education Review, 80, 106–134.

Sears, D. O. (1986). College sophomores in the laboratory: Influences of a narrow data base on social psychology’s view of human nature. Journal of Personality and Social Psychology, 51, 515–530.

Shaw, C. M., & Tan, S. A. (2015). Integration of mobile technology in educational materials improves participation: Creation of a novel smartphone application for resident education. Journal of Surgical Education, 72(4), 670–73. https://www.sciencedirect.com/science/article/abs/pii/S1931720415000318

Shrout, P. E., & Rodgers, J. L. (2018). Psychology, science, and knowledge construction: Broadening perspectives from the replication crisis. Annual Review of Psychology, 69, 487-510.

Strauss, V. (2019, March 19). Is it finally time to get rid of the SAT and ACT college admissions tests? The Washington Post. https://www.washingtonpost.com/education/2019/03/19/is-it-finally-time-get-rid-sat-act-college-admissions-tests/

Tuskegee University. (n.d.). About the USPHS Syphilis Study. http://www.tuskegee.edu/about_us/centers_of_excellence/bioethics_center/about_the_usphs_syphilis_study.aspx.

Women and Minorities in Psychology. (n.d.). IResearch. http://psychology.iresearchnet.com/history-of-psychology/women-and-minorities/


この訳文は元の本のCreative Commons BY 4.0ライセンスに従って同ライセンスにて公開します。問題がありましたら、可能な限り早く対応いたしますので、ご連絡ください。また、誤訳・不適切な表現等ありましたらご指摘ください。この本は、https://openstax.org/details/books/psychology-2eで無料でダウンロードできます。