橫幅4

 

28.流行病學與統計學

章節編輯:  Franco Merletti、Colin L. Soskolne 和 Paolo Vineis


目錄

表格和數字

流行病學方法應用於職業健康與安全
Franco Merletti、Colin L. Soskolne 和 Paolo Vineis

暴露評估
M·杰拉爾德·奧特

總結工作生活接觸措施
科林·L·索斯科尼

測量暴露的影響
謝莉亞·霍爾·扎姆

     案例研究:措施
     Franco Merletti、Colin L. Soskolne 和 Paola Vineis

研究設計中的選項
斯文赫恩伯格

研究設計中的有效性問題
安妮·薩斯科

隨機測量誤差的影響
Paolo Vineis 和 Colin L. Soskolne

統計方法
Annibale Biggeri 和馬里奧布拉加

流行病學研究中的因果關係評估和倫理
保羅維尼斯

說明職業病監測方法論問題的案例研究
王正德

流行病學調查問卷
Steven D. Stellman 和 Colin L. Soskolne

石棉歷史透視
勞倫斯加芬克爾

單擊下面的鏈接以在文章上下文中查看表格.

1. 五個選定的工作生活暴露的總結措施

2. 疾病發生的措施

3. 隊列研究的關聯測量

4. 病例對照研究的關聯措施

5. 群組數據的一般頻率表佈局

6. 病例對照數據的樣本佈局

7. 佈局病例對照數據 - 每個病例一個對照

8. 1950 個人的假設隊列到 T2

9. 集中趨勢和分散指數

10. 二項式實驗和概率

11. 二項式實驗的可能結果

12. 二項式分佈,15 次成功/30 次試驗

13. 二項分佈,p = 0.25; 30次試驗

14. II 類錯誤和功效; x = 12, n = 30,一個 = 0.05

15. II 類錯誤和功效; x = 12, n = 40,一個 = 0.05

16. 632 名工人接觸石棉 20 年或更長時間

17. O/E 632 名石棉工人的死亡人數

人物

指向縮略圖以查看圖片標題,單擊以在文章上下文中查看圖片.

EPI110F1EPI110F2


點擊返回頁面頂部

星期一,二月28 2011 20:57

流行病學方法應用於職業健康與安全

流行病學

流行病學被認為是預防醫學的基礎科學,也是為公共衛生政策過程提供信息的科學。 已經提出了幾種流行病學的操作定義。 最簡單的是,流行病學是研究人類和動物種群中疾病或其他與健康相關的特徵的發生。 流行病學家不僅研究疾病的頻率,而且研究頻率是否因人群而異; 即,他們研究暴露與疾病之間的因果關係。 疾病不是隨機發生的; 它們有原因——通常是人為原因——是可以避免的。 因此,如果知道病因,許多疾病是可以預防的。 流行病學方法對於確定許多致病因素至關重要,這些致病因素反過來又導致制定旨在預防疾病、傷害和過早死亡的衛生政策。

流行病學的任務是什麼?當流行病學的定義和概念應用於職業健康時,它的優缺點是什麼? 本章解決了這些問題以及使用流行病學技術調查職業健康危害的方法。 本文介紹了本章後續文章中的思想。

職業流行病學

職業流行病學被定義為研究工作場所暴露對人群中疾病和傷害的頻率和分佈的影響。 因此,它是一門以暴露為導向的學科,與流行病學和職業健康都有聯繫(Checkoway 等人,1989 年)。 因此,它使用的方法類似於流行病學一般採用的方法。

職業流行病學的主要目標是通過確定工作場所暴露對健康的影響來進行預防。 這強調了職業流行病學的預防重點。 事實上,職業健康與安全領域的所有研究都應服務於預防目的。 因此,流行病學知識可以而且應該易於實施。 雖然公共衛生利益始終應該是流行病學研究的主要關注點,但既得利益可以施加影響,必須注意在研究的製定、實施和/或解釋中盡量減少這種影響(Soskolne 1985;Soskolne 1989)。

職業流行病學的第二個目標是使用特定環境的結果來減少或消除整個人群中的危害。 因此,除了提供有關工作場所暴露對健康影響的信息外,職業流行病學研究的結果還在估計與相同暴露相關但一般人群普遍經歷的較低水平的風險方面發揮作用。 工業過程和產品造成的環境污染通常會導致接觸水平低於工作場所的接觸水平。

職業流行病學的應用層次有:

  • 監測以描述不同類別工人的疾病發生情況,從而提供未識別的職業危害的早期預警信號
  • 生成和檢驗給定暴露可能有害的假設,以及影響的量化
  • 通過測量人群健康狀況隨時間的變化來評估干預措施(例如,預防措施,如降低暴露水平)。

 

職業暴露在疾病、傷害和過早死亡的發展中可能發揮的因果作用早已被確定,並且是流行病學歷史的一部分。 必須參考 Bernardino Ramazzini,他是職業醫學的創始人,也是最早復興和補充健康依賴於可識別的自然外部因素的希波克拉底傳統的人之一。 1700 年,他在他的“De Morbis Artificum Diatriba”(Ramazzini 1705;Saracci 1995)中寫道:

醫生不得不問病人很多問題。 希波克拉底在 情書: “當你面對一個病人時,你應該問他,他的病是什麼,為什麼,病了多少天,他吃了什麼,他的大便情況如何。 對於所有這些問題,應該添加一個:'他做什麼工作?'。

這種對臨床觀察和對疾病發生周圍環境的關注的重新喚醒,使 Ramazzini 識別和描述了許多後來被職業醫生和流行病學家研究的職業病。

使用這種方法,Pott 於 1775 年首先報告了癌症與職業之間可能存在的聯繫 (Pott 1775) (Clayson 1962)。 他對煙囪清潔工陰囊癌的觀察始於對該疾病的描述,並繼續說:

這些人的命運似乎異常艱難:在他們幼年時期,他們最常遭受殘酷對待,幾乎餓得又冷又餓; 他們被推上狹窄的、有時是熱的煙囪,在那裡他們被擦傷、燒傷,幾乎窒息; 當他們進入青春期時,特別容易患上最令人討厭、痛苦和致命的疾病。

對於這最後一種情況,毫無疑問,儘管可能沒有得到足夠的關注,以使其廣為人知。 其他人有相同部位的癌症; 除了鉛工、普瓦圖腸絞痛和隨之而來的癱瘓之外,其他人也是如此; 但這仍然是他們特別容易患上的一種疾病。 掃煙囪的人也會患上陰囊和睾丸癌。

在這些人身上,這種疾病似乎起源於陰囊褶皺中積聚的煙灰,起初並不是一種習慣病……但這裡的受試者很年輕,總體上身體健康,至少首先; 他們的職業給他們帶來的疾病,很可能是當地的; 最後一種情況,我認為,可以從它總是抓住相同的部分而被合理地推定出來; 所有這些使得它(起初)與出現在老年男性身上的癌症截然不同。

這個關於職業癌症的第一個記錄仍然是清醒的典範。 疾病的性質、有關的職業和可能的致病因素都已明確界定。 儘管沒有提供定量數據來證實這一說法,但注意到煙囪清潔工中陰囊癌的發病率有所增加。

又過了五十年,Ayrton-Paris 在 1822 年註意到 (Ayrton-Paris 1822) 康沃爾的銅和錫冶煉廠經常發生陰囊癌,並推測砷煙可能是致病因子。 馮·沃爾克曼 (Von Volkmann) 於 1874 年報告了薩克森石蠟工人的皮膚腫瘤,此後不久,貝爾 (Bell) 於 1876 年提出頁岩油是導致皮膚癌的原因 (Von Volkmann 1874;貝爾 1876)。 癌症的職業起源的報告隨後變得相對頻繁(Clayson 1962)。

在職業病的早期觀察中,Schneeberg 礦工的肺癌發病率有所增加(Harting 和 Hesse,1879 年)。 值得注意(也是悲慘的),最近的一項案例研究表明,施內貝格的肺癌流行仍然是一個巨大的公共衛生問題,距 1879 年首次觀察到肺癌已有一個多世紀了。一種確定疾病“增加”的方法甚至量化它已經存在於職業醫學的歷史中。 例如,正如 Axelson (1994) 所指出的,WA Guy 在 1843 年研究了凸版印刷機的“肺部消耗”,發現排字工的風險高於印刷工; 這是通過應用類似於病例對照方法的設計來完成的(Lilienfeld 和 Lilienfeld 1979)。 然而,也許直到 1950 世紀 1954 年代初,現代職業流行病學及其方法才開始發展。 標誌著這一發展的主要貢獻是對染料工人的膀胱癌(Case 和 Hosker 1952)和天然氣工人的肺癌(Doll XNUMX)的研究。

職業流行病學問題

本章中的文章介紹了流行病學調查的理念和工具。 他們專注於評估工人的暴露經歷以及這些人群中出現的疾病。 本章討論了就從接觸有害物質到疾病發展的途徑中可能存在的因果關係得出有效結論的問題。

確定個人的工作生活暴露經歷構成了職業流行病學的核心。 流行病學研究的信息量首先取決於可用暴露數據的質量和範圍。 其次,職業流行病學家關注的健康影響(或疾病)必須在定義明確且易於接近的工人群體中準確確定。 最後,流行病學家應獲得有關對感興趣疾病的其他潛在影響的數據,以便從研究中確定的任何職業暴露影響都可以歸因於職業暴露 本身 而不是有關疾病的其他已知原因。 例如,在一群可能使用疑似導致肺癌的化學品的工人中,一些工人可能也有吸煙史,這是肺癌的進一步誘因。 在後一種情況下,職業流行病學家必須確定哪種接觸(或哪種風險因素——化學品或煙草,或者實際上是兩者的結合)是導致正在工作的工人群體患肺癌風險增加的原因學習了。

暴露評估

如果一項研究只能獲得工人受僱於特定行業這一事實,那麼此類研究的結果只能將健康影響與該行業聯繫起來。 同樣,如果存在關於工人職業的暴露知識,則只能就職業而言直接得出結論。 可以對化學暴露進行間接推斷,但必鬚根據具體情況評估其可靠性。 然而,如果一項研究可以訪問有關部門和/或每個工人的職位的信息,那麼就能夠得出更精細的工作經驗水平的結論。 如果流行病學家(與工業衛生學家合作)知道關於一個人工作的實際物質的信息,那麼這將是在缺乏很少可用的劑量測定的情況下可用的最佳暴露信息水平。 此外,此類研究的結果可以為行業提供更有用的信息,以創建更安全的工作場所。

直到現在,流行病學一直是一門“黑箱”學科,因為它研究的是暴露與疾病(因果鏈的兩個極端)之間的關係,而沒有考慮中間的機制步驟。 這種方法,儘管明顯缺乏改進,但卻非常有用:事實上,例如,所有已知的人類癌症原因都是通過流行病學工具發現的。

流行病學方法基於可用的記錄——調查問卷、職位或其他暴露“代理”; 這使得流行病學研究的開展和對研究結果的解釋相對簡單。

然而,近年來,隨著流行病學家面臨更複雜的問題,更粗略的暴露評估方法的局限性越來越明顯。 將我們的考慮局限於職業性癌症流行病學,由於過去的高水平接觸,已經發現了大多數眾所周知的風險因素; 每項工作的曝光次數有限; 大量暴露的工人; “代理”信息與化學品接觸(例如,製鞋工人和苯、造船廠和石棉等)之間存在明確的對應關係。 如今,情況大不相同:西方國家的暴露水平要低得多(應始終強調這一條件); 工人在同一職位(例如,農業工人)中會接觸到許多不同的化學品和混合物; 暴露工人的同類人群更難找到,而且通常人數很少; 而且,“代理”信息與實際曝光之間的對應關係逐漸變弱。 在這種情況下,由於暴露的錯誤分類,流行病學工具的敏感性降低了。

此外,流行病學依賴於“硬”終點,例如大多數隊列研究中的死亡。 然而,在研究職業暴露的潛在健康影響時,工作人員可能更願意看到不同於“人體計數”的東西。 因此,使用更直接的暴露和早期反應指標會有一些優勢。 生物標記可能只是提供了一種工具。

生物標記

使用生物標誌物,例如血液中的鉛含量或肝功能測試,在職業流行病學中並不新鮮。 然而,分子技術在流行病學研究中的應用使得使用生物標誌物評估靶器官暴露、確定易感性和確定早期疾病成為可能。

生物標誌物在職業流行病學背景下的潛在用途是:

  • 在傳統流行病學工具不足的情況下進行暴露評估(特別是對於低劑量和低風險)
  • 解開單一化學試劑或物質在多次接觸或混合物中的致病作用
  • 估計接觸具有相同機械目標的化學品的總負擔
  • 發病機制調查
  • 個體易感性研究(例如,代謝多態性、DNA 修復)(Vineis 1992)
  • 更準確地對暴露和/或疾病進行分類,從而提高統計能力。

 

科學界對這些用途產生了極大的熱情,但是,如上所述,使用這些新“分子工具”的方法論複雜性應該提醒人們不要過度樂觀。 化學暴露的生物標誌物(如 DNA 加合物)有幾個缺點:

  1. 它們通常反映最近的暴露情況,因此在病例對照研究中的用途有限,而它們需要長時間重複採樣才能用於隊列研究。
  2. 雖然它們可以非常具體並因此改善暴露錯誤分類,但結果通常仍然難以解釋。
  3. 當研究複雜的化學暴露(例如,空氣污染或環境煙草煙霧)時,生物標誌物可能會反映混合物的一種特定成分,而生物學效應可能是由另一種成分引起的。
  4. 在許多情況下,尚不清楚生物標誌物是否反映了相關暴露、相關暴露的相關性、個體易感性或早期疾病階段,從而限制了因果推斷。
  5. 大多數生物標誌物的確定需要昂貴的測試或侵入性程序或兩者兼而有之,因此對足夠的研究規模和統計能力產生了限制。
  6. 暴露的生物標誌物只不過是流行病學調查真正目標的代表,通常,流行病學調查側重於可避免的環境暴露(Trichopoulos 1995 年;Pearce 等人 1995 年)。

 

比方法論上的缺點更重要的是,考慮到分子技術可能會使我們將注意力從識別外源環境中的風險轉移到識別高風險個體,然後通過測量表型、加合物負荷和獲得性突變進行個性化風險評估。 正如 McMichael 指出的那樣,這會將我們的重點轉向一種臨床評估形式,而不是公共衛生流行病學。 關注個人可能會分散我們對創造危害較小環境這一重要公共衛生目標的注意力(McMichael 1994)。

關於生物標誌物的使用出現了另外兩個重要問題:

  1. 就知情同意而言,在職業流行病學中使用生物標誌物必須附有明確的政策。 工人可能有多種理由拒絕合作。 一個非常實際的原因是,例如識別姐妹染色單體交換等早期反應標記的改變意味著可能受到健康和人壽保險公司以及雇主的歧視,他們可能會避開工人,因為他或她可能更容易到疾病。 第二個原因與基因篩查有關:由於基因型和表型的分佈因種族而異,少數民族的職業機會可能會受到基因篩查的阻礙。 第三,可以對基因檢測的可預測性提出質疑:由於預測值取決於檢測旨在識別的疾病的流行程度,如果後者很少見,預測值就會很低,篩查的實際應用也會受到影響。測試將受到質疑。 直到現在,還沒有一種基因篩選測試被認為適用於該領域(Ashford et al. 1990)。
  2. 在使用生物標誌物之前必須應用倫理原則。 在歐洲共同體委員會的支持下,歐洲工會技術辦公室的一個跨學科工作組已經對這些原則進行了評估,用於確定個體對疾病易感性的生物標誌物(Van Damme 等人,1995 年); 他們的報告強化了這樣一種觀點,即只能以預防勞動力疾病為目的進行檢測。 除其他考慮因素外,必須使用測試 決不.

 

  • 作為“優勝劣汰”的手段
  • 用於避免實施有效的預防措施,例如識別和替代風險因素或改善工作場所條件
  • 造成、確認或加劇社會不平等
  • 在工作場所遵循的道德原則與民主社會必須堅持的道德原則之間製造差距
  • 要求求職者披露除獲得工作所必需的個人詳細信息以外的個人詳細信息。

 

最後,越來越多的證據表明,有害物質(尤其是致癌物)的代謝激活或失活在人群中差異很大,部分由基因決定。 此外,在低水平的職業和環境暴露下,個體間對致癌物易感性的差異可能特別重要(Vineis 等人,1994 年)。 這些發現可能會強烈影響將風險評估過程集中在最易受影響人群的監管決策(Vineis 和 Martone 1995)。

研究設計和有效性

Hernberg 關於流行病學研究設計及其在職業醫學中的應用的文章集中討論了“研究基礎”的概念,該概念被定義為隨著時間的推移人口的發病率經歷(與某些暴露相關)。 因此,研究的基礎不僅僅是一個人群(即一群人),而是這個人群在一定時期內疾病發生的經歷(Miettinen 1985,Hernberg 1992)。 如果採用這種統一的研究基礎概念,那麼重要的是要認識到不同的研究設計(例如,病例對照和隊列設計)只是從同一研究中“收集”有關暴露和疾病信息的不同方式根據; 它們不是截然不同的方法。

Sasco 關於研究設計有效性的文章闡述了混雜的定義和重要性。 研究調查人員必須始終考慮職業研究中混雜的可能性,並且永遠不能充分強調潛在混雜變量的識別是任何研究設計和分析的組成部分。 職業流行病學必須解決混雜的兩個方面:

  1. 應探索負面混雜因素:例如,一些工業人群由於無菸工作場所而很少接觸與生活方式相關的風險因素; 吹玻璃工往往比一般人吸煙少。
  2. 當考慮混雜時,應該評估其方向及其潛在影響的估計。 當控制混雜的數據很少時尤其如此。 例如,吸煙是職業流行病學中的一個重要混雜因素,應始終予以考慮。 然而,當沒有關於吸煙的數據時(隊列研究中經常出現這種情況),吸煙不太可能解釋職業群體中發現的大量過量風險。 Axelson (1978) 在一篇論文中很好地描述了這一點,Greenland (1987) 進一步討論了這一點。 當文獻中提供了關於職業和吸煙的詳細數據時,混雜似乎並沒有嚴重扭曲關於肺癌與職業之間關聯的估計(Vineis 和 Simonato 1991)。 此外,疑似混雜並不總是會引入無效關聯。 由於研究人員也有被其他未檢測到的觀察和選擇偏差誤入歧途的風險,因此在設計研究時,這些應該與混雜問題一樣受到重視(Stellman 1987)。

 

時間和時間相關的變量,如風險年齡、日曆週期、自僱用以來的時間、自首次接觸以來的時間、接觸持續時間及其在分析階段的治療,是職業流行病學中最複雜的方法論問題。 本章不涉及它們,但指出了兩個相關的最新方法參考文獻(Pearce 1992;Robins 等人 1992)。

統計

Biggeri和Braga關於統計的文章以及本章的標題表明,統計方法離不開流行病學研究。 這是因為:(a) 對統計的正確理解可以為調查的正確設計提供有價值的見解,以及 (b) 統計和流行病學有共同的遺產,流行病學的整個定量基礎是基於概率的概念(克萊頓 1992 年;克萊頓和希爾斯 1993 年)。 在隨後的許多文章中,使用概率論證和適當的研究設計評估了假設因果關係的經驗證據和證明。 例如,重點放在估計利率或相對風險等利率風險度量上,以及圍繞這些估計構建置信區間,而不是執行概率統計檢驗(Poole 1987;Gardner 和 Altman 1989;Greenland 1990 ). 提供了使用二項分佈進行統計推理的簡要介紹。 統計數據應該是科學推理的伴侶。 但如果沒有適當設計和進行的研究,它就毫無價值。 統計學家和流行病學家意識到,方法的選擇決定了我們進行觀察的內容和程度。 因此,深思熟慮地選擇設計選項對於確保有效觀察至關重要。

倫理

Vineis 的最後一篇文章解決了流行病學研究中的倫理問題。 本簡介中要提到的要點是指流行病學作為一門學科,根據定義需要採取預防措施。 關於保護工人和廣大民眾的具體倫理問題需要承認:

  • 職業環境中的流行病學研究不應延誤工作場所的預防措施。
  • 職業流行病學不是指生活方式因素,而是指通常在接觸選擇中很少或沒有個人作用的情況。 這意味著對有效預防和立即向工人和公眾傳播信息的特別承諾。
  • 研究揭示健康危害並提供預防措施的知識。 在可行的情況下,不進行研究的倫理問題應予以考慮。
  • 向工作人員通報流行病學研究結果既是風險交流中的倫理問題,也是方法論問題。 應高度重視評估通知的潛在影響和有效性的研究(Schulte 等人,1993 年)。

 

職業流行病學培訓

具有不同背景的人可以找到進入職業流行病學專業的途徑。 在該領域的專業人士中,醫學、護理和統計學是更有可能出現的一些背景。 在北美,大約一半受過培訓的流行病學家具有科學背景,而另一半則沿著醫學博士的道路前進。 在北美以外的國家,大多數職業流行病學專家都晉升為醫學博士。 在北美,接受過醫學培訓的人往往被認為是“內容專家”,而那些通過科學途徑接受過培訓的人則被認為是“方法論專家”。 內容專家與方法專家合作以設計和進行盡可能最好的研究通常是有利的。

職業流行病學專業不僅需要流行病學方法、統計學和計算機方面的知識,還需要毒理學、工業衛生和疾病登記方面的知識(Merletti 和 Comba,1992 年)。 由於大型研究可能需要與疾病登記處聯繫,因此了解人口數據來源很有用。 勞工和公司組織的知識也很重要。 碩士論文和博士論文培訓使學生具備在工人中進行大量基於記錄和訪談的研究所需的知識。

歸因於職業的疾病比例

至少在癌症的另一部分涵蓋了一組暴露工人或一般人群中可歸因於職業暴露的疾病比例 百科全書. 在這裡我們應該記住,如果計算估計值,它應該針對特定疾病(以及癌症情況下的特定部位)、特定時間段和特定地理區域。 此外,它應該基於對暴露人群比例和暴露程度的準確測量。 這意味著可歸因於職業的疾病比例可能從某些人群中的非常低或零到位於工業區的其他人群中的非常高,例如,多達 40% 的肺癌可歸因於職業暴露(Vineis和 Simonato 1991)。 沒有基於對精心設計的流行病學研究的詳細審查的估計充其量只能被視為有根據的猜測,並且價值有限。

危險產業轉移

大多數流行病學研究都是在發達國家進行的,在過去幾十年裡,發達國家對已知職業危害的監管和控制降低了患病風險。 然而,與此同時,大量危險產業轉移到了發展中國家(Jeyaratnam 1994)。 以前在美國或歐洲被禁止的化學品現在在發展中國家生產。 例如,石棉加工已從美國轉移到墨西哥,聯苯胺生產從歐洲國家轉移到前南斯拉夫和韓國(Simonato 1986 年;LaDou 1991 年;Pearce 等人 1994 年)。

發展中國家職業風險水平和工作條件的一個間接標誌是其中一些國家正在流行急性中毒。 根據一項評估,全世界每年約有 20,000 人死於急性殺蟲劑中毒,但這很可能被嚴重低估了(Kogevinas 等人,1994 年)。 據估計,99% 的急性農藥中毒死亡發生在發展中國家,而這些國家僅使用了世界上 20% 的農用化學品(Kogevinas 等人,1994 年)。 這就是說,即使流行病學研究似乎表明職業危害有所減少,這也可能僅僅是因為大多數此類研究都是在發達國家進行的。 職業危害可能只是轉移到了發展中國家,全世界的職業暴露總負擔可能增加了(Vineis 等人,1995 年)。

獸醫流行病學

出於顯而易見的原因,獸醫流行病學與職業健康和職業流行病學並不直接相關。 然而,疾病的環境和職業原因的線索可能來自對動物的流行病學研究,原因如下:

  1. 與人類相比,動物的壽命相對較短,疾病(例如大多數癌症)的潛伏期在動物中比在人類中短。 這意味著發生在野生動物或寵物動物身上的疾病可以作為哨兵事件,提醒我們在通過其他方式識別之前存在潛在的環境毒物或人類致癌物 (Glickman 1993)。
  2. 可以在野生動物和寵物動物身上測量暴露標記,例如血紅蛋白加合物或毒素的吸收和排泄水平,以評估工業來源的環境污染(Blondin 和 Viau 1992 年;Reynolds 等人 1994 年;Hungerford 等人 1995 年) .
  3. 動物不會暴露於某些可能在人類研究中作為混雜因素的因素,因此可以在不考慮這些潛在混雜因素的情況下對動物種群進行調查。 例如,一項關於寵物狗肺癌的研究可能會發現這種疾病與接觸石棉之間存在顯著關聯(例如,通過主人的石棉相關職業和與石棉工業來源的接近程度)。 顯然,這樣的研究將消除主動吸煙作為混雜因素的影響。

 

獸醫談論獸醫學的流行病學革命(Schwabe 1993),並且出現了有關該學科的教科書(Thrusfield 1986;Martin 等人 1987)。 當然,環境和職業危害的線索來自人類和動物流行病學家的共同努力。 其中,苯氧基除草劑對綿羊和狗的影響(Newell 等人,1984 年;Hayes 等人,1990 年)、磁場(Reif 等人,1995 年)和被類石棉化合物污染的殺蟲劑(尤其是跳蚤製劑)對狗的影響(Glickman et al. 1983) 是顯著的貢獻。

參與式研究、交流結果和預防

重要的是要認識到職業健康領域的許多流行病學研究都是通過工人自身的經驗和關注而發起的(Olsen 等人,1991 年)。 通常,那些曾經和/或現在暴露在外的工人在研究證實之前很久就認為有什麼地方不對勁。 職業流行病學可以被認為是一種“理解”工人經歷、以系統方式收集和分組數據並推斷導致其健康不良的職業原因的方法。 此外,工人本身、他們的代表和負責工人健康的人是解釋所收集數據的最合適人選。 因此,他們應該始終積極參與在工作場所進行的任何調查。 只有他們的直接參與才能保證研究人員離開後工作場所仍然安全。 任何研究的目的都是利用研究結果預防疾病和殘疾,而這項研究的成功在很大程度上取決於確保暴露者參與獲得和解釋研究結果。 當工人​​尋求因工作場所暴露造成的損害賠償時,研究結果在訴訟過程中的作用和使用超出了本章的範圍。 對於這方面的一些見解,讀者可以參考別處(Soskolne、Lilienfeld 和 Black 1994)。

確保開展職業流行病學研究的參與式方法在一些地方已成為標準做法,其形式是建立指導委員會,以監督研究計劃從開始到完成的整個過程。 這些委員會的結構是多方的,包括勞工、科學、管理和/或政府。 在研究過程中有所有利益相關者團體的代表,由於他們的可信度提高,結果的交流將變得更加有效,因為“他們自己的人”會一直監督研究並將調查結果傳達給他或她各自的選區。 這樣,就有可能實現最大程度的有效預防。

職業健康研究中的這些和其他參與式方法是在那些經歷過或受到與暴露有關的關注問題影響的人的參與下進行的。 這應該在所有流行病學研究中更常見(Laurell 等人,1992 年)。 重要的是要記住,雖然在流行病學工作中,分析的目標是估計風險的大小和分佈,但在參與式研究中,風險的可預防性也是一個目標(Loewenson 和 Biocca 1995)。 流行病學和有效預防的這種互補性是本次活動信息的一部分 百科全書 和這一章。

保持公共衛生相關性

儘管流行病學方法、數據分析以及暴露評估和測量(例如新的分子生物學技術)方面的新發展受到歡迎並且很重要,但它們也可以促進以個人而非人群為重點的還原論方法。 有人說:

......流行病學在很大程度上已不再作為理解人群疾病原因的多學科方法的一部分發揮作用,而是成為一套衡量個人暴露與疾病關聯的通用方法......目前忽視了社會,經濟,文化、歷史、政治和其他人口因素作為疾病的主要原因……流行病學必須重新融入公共衛生,並且必須重新發現人口觀點(Pearce 1996)。

職業和環境流行病學家可以發揮重要作用,不僅在開發新的流行病學方法和這些方法的應用方面,而且在確保這些方法始終從適當的人口角度整合方面。

 

返回

星期一,二月28 2011 21:01

暴露評估

暴露評估是通過流行病學調查識別工作場所危害的關鍵步驟。 暴露評估過程可細分為一系列活動。 這些包括:

  1. 編制目標工作環境中存在的潛在有毒物質和混合物的清單
  2. 確定暴露是如何發生的以及它們在員工之間發生變化的可能性有多大
  3. 選擇適當的措施或指數來量化風險敞口
  4. 收集數據,使研究參與者能夠為每項措施分配定性或定量暴露值。 只要有可能,這些活動都應在合格的工業衛生師的指導下進行。

 

由於暴露評估的不足,職業健康研究經常受到批評。 不足之處可能導致暴露的差異或非差異錯誤分類以及隨後的暴露效應分析中的偏差或精度損失。 最近幾次國際會議和專門討論該主題的文本證明了改善這種情況的努力(ACGIH 1991 年;Armstrong 等人 1992 年;流行病學職業暴露回顧性評估會議論文集 1995 年)。 顯然,技術發展為推進暴露評估提供了新的機會。 這些發展包括分析儀器的改進、對藥代動力學過程的更好理解以及新的暴露生物標誌物的發現。 由於職業健康研究通常依賴於沒有進行特定監測的歷史暴露信息,因此對回顧性暴露評估的需求為這些研究增加了額外的複雜性。 然而,改進的評估標準和確保此類評估可靠性的標準仍在繼續開發中(Siemiatycki 等人,1986 年)。 當然,前瞻性暴露評估更容易得到驗證。

術語 曝光 是指藥劑在個體和環境之間的邊界處的濃度。 當已知代理人出現在工作環境中並且有合理的預期員工會與該代理人接觸時,通常會假定接觸。 暴露可以表示為 8 小時時間加權平均 (TWA) 濃度,這是對 8 小時工作班次的平均暴露強度的度量。 峰值濃度是較短時間段(例如 15 分鐘)內的平均強度。 累積暴露量是平均強度和持續時間的乘積(例如,平均 8 小時 TWA 濃度乘以在該平均濃度下工作的年數)。 根據研究的性質和感興趣的健康結果,可能需要評估峰值、平均強度、累積或滯後暴露。

相比之下, 劑量 指單位時間內藥劑的沉積或吸收。 可以通過將環境測量數據與關於呼吸率和皮膚滲透等因素的標准假設相結合來估計藥劑的劑量或每日攝入量。 或者,可以根據生物監測數據估計攝入量。 理想情況下,劑量將在感興趣的目標器官處測量。

重要的暴露評估因素包括:

  1. 識別相關代理人
  2. 確定它們在適當環境介質(例如空氣、接觸面)中的存在和濃度
  3. 評估可能的進入途徑(吸入、皮膚吸收、攝入)、接觸時間過程(每日變化)以及以周、月或年表示的累積接觸持續時間
  4. 評估工程和個人控制的有效性(例如,使用防護服和呼吸保護裝置可能會減少暴露),最後
  5. 宿主和其他可能調節靶器官濃度的因素。

 

這些包括工作活動的身體水平和個人先前的健康狀況。 在評估暴露於具有持久性或易於生物累積的物質(例如,某些金屬、放射性核素或穩定的有機化合物)時,應特別小心。 使用這些材料,即使環境濃度看起來很低,體內負擔也可能會不知不覺地增加。

雖然情況可能相當複雜,但通常情況並非如此。 當然,許多對識別職業危害的有價值的貢獻來自使用常識性方法進行暴露評估的研究。 有助於識別和分類暴露的信息來源包括:

  1. 員工訪談
  2. 雇主人員和生產記錄(包括工作記錄、工作描述、設施和工藝歷史以及化學品庫存)
  3. 專家的判斷
  4. 工業衛生記錄(區域、個人和合規性監測、表面擦拭樣本,以及健康危害或綜合調查報告)
  5. 與長期或退休員工的面談,以及
  6. 生物監測數據。

 

盡可能詳細地對個人暴露進行分類有幾個優點。 顯然,如果相關暴露得到充分描述,研究的信息量將得到增強。 其次,研究結果的可信度可能會增加,因為可以更令人滿意地解決混雜的可能性。 例如,參考對象和暴露個體在暴露狀態方面會有所不同,但也可能相對於感興趣疾病的其他測量和未測量解釋因素有所不同。 然而,如果可以在研究人群中建立暴露梯度,則相同程度的混雜將不太可能在暴露亞組中持續存在,從而加強整體研究結果。

職位曝光矩陣

一種更實用和經常使用的暴露評估方法是根據職位間接估計暴露。 指某東西的用途 工作接觸矩陣 當有完整的工作經歷並且與正在研究的工作相關的任務和接觸具有合理的穩定性時,這種方法可能是有效的。 在最廣泛的範圍內,標準行業和職位分組是根據定期收集的人口普查數據或死亡證明上提供的職業數據設計的。 不幸的是,這些大型記錄系統中維護的信息通常僅限於“當前”或“通常”的職業。 此外,由於標準分組沒有考慮到特定工作場所的條件,因此通常必須將它們視為粗略的暴露替代指標。

對於基於社區和註冊的病例對照研究,通過利用專家意見將通過個人訪談獲得的工作歷史數據轉化為可能接觸特定藥物的半定量評估,已經實現了更詳細的接觸評估(Siemiatycki 等人,1986 年) ). 專家,如化學家和工業衛生學家,由於他們對各種工業過程的知識和熟悉程度,被選中協助進行暴露評估。 通過將詳細的問卷數據與工業流程知識相結合,這種方法有助於描述工作設施之間的暴露差異。

工作暴露矩陣方法也已成功用於特定行業和公司的研究(Gamble 和 Spirtas 1976)。 個人工作經歷(每個員工過去的部門和工作分配的時間順序列表)通常保留在公司人事檔案中,並且在可用時為員工在該工廠工作時提供完整的工作經歷。 可以通過對研究參與者的個人訪談來擴展這些數據。 下一步是清點研究期間使用的所有職位名稱和部門或工作區域名稱。 當生產、維護、研究、工程、工廠支持服務和行政工作都隨著時間的推移(通常是幾十年)考慮時,這些可能很容易在大型、多過程設施或跨公司的行業內達到數百甚至數千個,允許改變工業過程。 通過創建所有工作歷史記錄的計算機文件,然後使用編輯例程來標準化職位術語,可以促進數據整合。 那些涉及相對同質風險的工作可以結合起來,以簡化將風險與個別工作聯繫起來的過程。 然而,工作和工作地點的分組應盡可能得到根據合理的抽樣策略收集的測量數據的支持。

即使使用計算機化的工作歷史,將暴露數據與個人進行追溯關聯也可能是一項艱鉅的任務。 當然,隨著技術的變化、產品需求的變化和新法規的出台,工作場所的條件也會發生變化。 許多行業的產品配方和季節性生產模式也可能發生變化。 可能會保留有關某些更改的永久記錄。 但是,不太可能保留有關季節性和其他邊際過程和生產變化的記錄。 員工也可以接受培訓以執行多項工作,然後隨著生產需求的變化在工作之間輪換。 所有這些情況都增加了員工暴露情況的複雜性。 儘管如此,也有一些工作環境多年來一直保持相對不變。 歸根結底,每個工作環境都必鬚根據其自身的情況進行評估。

最終,有必要在一項研究中總結每個人的工作生活接觸史。 已證明對風險的最終暴露效應測量有相當大的影響(Suarez-Almazor 等人,1992 年),因此在選擇最合適的暴露匯總測量時必須非常小心。

工業衛生——環境測量

監測工作暴露是保護員工健康的一項基本持續活動。 因此,在計劃進行流行病學研究時,工業衛生記錄可能已經存在。 如果是這樣,則應對這些數據進行審查,以確定目標人群的覆蓋程度、文件中顯示了多少年的數據,以及測量與工作、工作區域和個人相關聯的難易程度。 這些決定將有助於評估流行病學研究的可行性,並有助於確定可以通過額外的暴露抽樣來彌補的數據差距。

如何最好地將測量數據與特定的工作和個人聯繫起來是一個特別重要的問題。 區域和呼吸區採樣可能有助於工業衛生學家識別排放源以採取糾正措施,但在描述實際員工暴露特徵時可能用處不大,除非對員工工作活動進行了仔細的時間研究。 例如,持續的區域監測可以識別一天中特定時間的偏移暴露,但問題仍然是員工當時是否在工作區域。

只要在代表性條件下進行採樣,適當考慮個人防護裝備的使用,並且每天的工作任務和工藝條件相對恆定,個人採樣數據通常可以提供更準確的員工暴露估計。 通過使用個人標識符,可以很容易地將個人樣本與個別員工聯繫起來。 這些數據可能會推廣到從事相同工作的其他員工,並推廣到其他有保證的時間段。 然而,根據他們自己的經驗,Rappaport 等人。 (1993) 警告說,即使在被分配到被認為是同質暴露組的員工中,暴露濃度也可能存在很大差異。 同樣,在決定是否可以假定同質暴露組時需要專家判斷。

研究人員已經成功地將工作暴露矩陣方法與環境測量數據的利用相結合,以估計矩陣單元格內的暴露。 當發現缺少測量數據時,可以通過使用暴露模型來填補數據空白。 一般來說,這涉及開發一個模型,將環境濃度與更容易評估的暴露濃度決定因素(例如,生產量、設施的物理特性,包括排氣通風系統的使用、藥劑揮發性和工作活動的性質)聯繫起來。 該模型是為具有已知環境濃度的工作環境構建的,然後用於估計缺乏測量數據但具有成分和產量等參數信息的類似工作環境中的濃度。 這種方法可能特別有助於暴露的回顧性估計。

另一個重要的評估問題是接觸混合物的處理。 首先,從分析的角度來看,單獨檢測化學相關化合物和消除樣品中存在的其他物質的干擾可能不在分析程序的能力範圍內。 需要評估用於提供測量數據的分析程序的各種局限性,並相應地修改研究目標。 其次,可能某些代理人幾乎總是一起使用,因此在所研究的整個工作環境中以大致相同的相對比例出現。 在這種情況下,內部統計分析 本身 將無助於區分效應是由於一種或另一種藥物引起的還是由於藥物的組合引起的。 此類判斷只能基於對未發生相同藥物組合的外部研究的審查。 最後,在根據產品規格互換使用不同材料的情況下(例如,使用不同的著色劑以獲得所需的顏色對比度),可能無法將效果歸因於任何特定的試劑。

生物監測

生物標誌物是可以在人體組織、細胞或體液等生物介質中測量的分子、生化或細胞變化。 開發暴露生物標誌物的一個主要原因是提供對特定藥劑的內部劑量的估計。 當可能有多種接觸途徑(例如吸入和皮膚吸收)、間歇性佩戴防護裝備或接觸條件不可預測時,這種方法特別有用。 當已知感興趣的試劑具有相對較長的生物半衰期時,生物監測可能特別有利。 從統計學的角度來看,根據環境變化的程度,半衰期短至 1991 小時的藥劑可以看出生物監測相對於空氣監測的優勢(Droz 和 Wu XNUMX)。 氯化二噁英等材料的超長半衰期(以年為單位)使這些化合物成為生物監測的理想候選物。 與測量空氣濃度的分析方法一樣,必須注意潛在的干擾。 例如,在使用特定代謝物作為生物標誌物之前,應確定其他常見物質(例如某些藥物和香煙煙霧中所含的物質)是否可以代謝到相同的終點。 一般而言,在將生物監測用作暴露評估的基礎之前,需要了解藥物的藥代動力學基礎知識。

最常見的測量點包括肺泡空氣、尿液和血液。 肺泡空氣樣本可能有助於表徵在收集樣本後幾分鐘或幾小時內發生的短期高溶劑暴露。 通常收集尿樣以確定目標化合物代謝物的排泄率。 可收集血樣用於直接測量化合物、測量代謝物或測定蛋白質或 DNA 加合物(例如,白蛋白或血紅蛋白加合物,以及循環淋巴細胞中的 DNA 加合物)。 也可以對可接近的組織細胞(例如來自口腔頰區的上皮細胞)進行取樣,以鑑定 DNA 加合物。

紅細胞和血漿中膽鹼酯酶活性的測定舉例說明了使用生化改變作為暴露量度。 有機磷殺蟲劑抑制膽鹼酯酶活性,因此在可能接觸這些化合物之前和之後測量該活性可以作為接觸強度的有用指標。 然而,隨著生物改變範圍的發展,區分暴露的生物標誌物和影響的生物標誌物變得更加困難。 一般而言,效應量度對於感興趣的物質往往是非特異性的,因此,可能需要評估其他可能的效應解釋,以支持將該參數用作暴露量度。 暴露量度應該直接與感興趣的代理相關聯,或者應該有一個合理的基礎將任何間接測量與代理相關聯。 儘管有這些資格,生物監測作為一種改進暴露評估以支持流行病學研究的手段仍有很大希望。

結論

在職業流行病學研究中進行比較時,需要將一組接觸過的工人與一組沒有接觸過的工人進行比較。 這種區分是粗略的,但有助於識別問題區域。 然而,顯然,暴露的測量越精細,研究就越有用,特別是在確定和製定適當的針對性干預計劃的能力方面。

 

返回

星期一,二月28 2011 21:03

總結工作生活接觸措施

研究人員很幸運,因為他們可以使用詳細的工人工作生活經歷年表,這些年表提供了對他們在一段時間內擔任的工作的歷史回顧。 對於這些工人來說 工作接觸矩陣 然後可以設置允許工人經歷的每一次工作變化都與特定的暴露信息相關聯。

必須總結詳細的暴露歷史以用於分析目的,以確定是否存在可能與工作場所的健康和安全問題相關的明顯模式。 我們可以想像一個工人在他或她的工作生涯中經歷過的 20 次工作變動的列表。 然後有幾種替代方法可以總結接觸細節(對於本例中的 20 個工作變動中的每一個),同時考慮接觸的持續時間和/或濃度/劑量/等級。

然而,重要的是要注意,根據所選擇的方法,一項研究可能會得出不同的結論(Suarez-Almazor 等人,1992 年)。 表 1 顯示了五個總結工作生活暴露測量的示例。

表 1. 五個選定的工作生活暴露總結度量的公式和維度或單位

暴露測量

公式

尺寸/單位

累積暴露指數 (CEI)

Σ(等級 x 暴露時間)

年級和時間

平均等級 (MG)

Σ(等級 x 暴露時間)/總暴露時間

有史以來最高等級 (HG)

暴露 ≥ 7 天的最高等級

時間加權平均 (TWA) 等級

Σ(等級 x 暴露時間)/總使用時間

暴露總時間 (TTE)

Σ 曝光時間

時間

改編自 Suarez-Almazor 等人。 1992.

累積暴露指數。 累積暴露指數 (CEI) 相當於毒理學研究中的“劑量”,表示在整個工作生命週期內,每個連續職稱的暴露等級和暴露持續時間的乘積之和。 它的單位包括時間。

平均成績。 平均等級 (MG) 累積每個連續職位(即 CEI)的接觸等級和接觸持續時間的乘積,然後除以任何大於零的等級的總接觸時間。 MG 在其單位中獨立於時間; 長時間高濃度暴露的人的簡要措施與短時間高濃度暴露的人相似。 在病例對照設計的任何匹配集中,MG 是每單位暴露時間的平均暴露等級。 它是實際接觸所考慮的代理人的時間的平均等級。

有史以來最高等級。 有史以來最高等級 (HG) 是通過掃描工人在至少 XNUMX 天的觀察期內最高等級分配的工作歷史來確定的。 HG 可能會歪曲一個人的工作生活暴露,因為根據其公式,它基於最大化而不是平均程序,因此獨立於其單位的暴露持續時間。

時間加權平均成績。 時間加權平均 (TWA) 等級是累積暴露指數 (CEI) 除以總使用時間。 在病例對照設計的任何匹配組中,TWA 成績平均佔總使用時間。 它與 MG 不同,MG 僅對實際曝光的總時間取平均值。 因此,TWA 等級可以被視為在整個就業期間每單位時間的平均暴露,而不管暴露 本身.

暴露的總時間。 總曝光時間 (TTE) 以時間為單位累積與曝光相關的所有時間段。 TTE 因其簡單性而具有吸引力。 然而,人們普遍認為,健康影響不僅與化學品接觸的持續時間有關,而且與接觸的強度(即濃度或等級)有關。

顯然,匯總暴露測量的效用取決於它賦予暴露持續時間或暴露濃度或兩者的相應權重。 因此,不同的措施可能會產生不同的結果(Walker 和 Blettner 1985)。 理想情況下,所選擇的總結措施應基於一組關於所研究的藥物或疾病關聯的假定生物學機制的可靠假設(Smith 1987)。 然而,這個過程並不總是可行的。 很多時候,暴露持續時間或所研究藥物濃度的生物學效應是未知的。 在這種情況下,使用不同的暴露措施可能有助於提出暴露發揮其作用的機制。

建議在沒有經過驗證的暴露評估模型的情況下,使用各種總結工作生活暴露措施來估計風險。 這種方法將有助於比較不同研究的結果。

 

返回

星期二,01 March 2011 01:58

測量暴露的影響

流行病學涉及測量疾病的發生和量化疾病與暴露之間的關聯。

疾病發生的措施

疾病的發生可以通過以下方式衡量 頻率 (計數)但更好地描述為 價格,它由三個要素組成:受影響的人數(分子)、受影響人來自的源或基人口(即風險人口)的人數,以及覆蓋的時間段。 比率的分母是源人口經歷的總人時。 比率允許在不同規模的人口之間進行比單獨計數更多的信息比較。 風險,個體在指定時間段內發生疾病的概率,是一個比例,範圍從0到1,不是比率 本身. 攻擊速度,即在特定時間段內受影響的人口比例,在技術上是一種風險衡量標準,而不是比率。

疾病特異性發病率包括 發生率,指的是新診斷出所關注疾病的人數。 流行 指的是現有案件的數量。 死亡 指死亡人數。

發生率 定義為指定時間段內新診斷病例數,而 發病率 是這個數字除以來源人口經歷的總人時(表 1)。 對於癌症,發病率通常表示為每 100,000 人的年發病率。 其他更常見疾病的發病率可以按較少人數表示。 例如,出生缺陷率通常表示為每 1,000 名活產嬰兒。 累計發病率,即在指定時間段內成為病例的人數比例,是衡量人口平均風險的指標。 

表 1. 疾病發生的度量:五年期間觀察的假設人群

新增確診病例

10

先前確診的活體病例

12

死亡,所有原因*

5

死亡,感興趣的疾病

3

人口中的人

100

觀察年數

5

發生率

10人

年發病率

點流行率(第 5 年末)

(10 + 12 - 3) = 19 人

期間流行率(五年期間)

(10 + 12) = 22 人

年死亡率

年死亡率

*為簡化計算,本例假設所有死亡都發生在五年期末,因此人口中所有 100 人都活了整整五年。

流行 包括 點流行度,某個時間點的疾病病例數,以及 經期患病率,已知在特定時期內某個時間存在的疾病病例總數。

死亡,它關注的是死亡而不是新診斷的疾病病例,它反映了導致疾病的因素以及與醫療質量相關的因素,例如篩查、獲得醫療服務和有效治療的可用性。 因此,當基於發病率而不是死亡率數據時,假設產生的努力和病因學研究可能會提供更多信息並且更容易解釋。 然而,與發病率數據相比,大量人群的死亡率數據通常更容易獲得。

術語 死亡率 通常被認為是指所有原因造成的總死亡率,而 死亡率 是某一特定原因造成的死亡率。 對於給定的疾病, 病死率 (技術上是比例,而不是比率)是在特定時間段內死於該疾病的人數除以患有該疾病的人數。 病死率的補數是 存活率. 五年生存率是癌症等慢性病的共同基準。

疾病的發生可能因人口亞組或時間而異。 不考慮任何亞組的整個人群的疾病測量稱為 粗率. 例如,所有年齡組的總發病率是粗率。 各個年齡段的費率是 特定年齡比率. 要比較兩個或多個具有不同年齡分佈的人群, 年齡調整 (或者, 年齡標準化) 應計算每個人口的比率,方法是將每個特定年齡的比率乘以該年齡組的標准人口(例如,研究中的人口之一,1970 年美國人口)的百分比,然後將所有年齡組相加產生一個整體的年齡調整率。 如果已知特定類別的比率,則可以根據年齡以外的因素調整比率,例如種族、性別或吸煙狀況。

描述性數據的監測和評估可以為疾病病因學提供線索,確定可能適合干預或篩查計劃的高風險亞群,並提供有關此類計劃有效性的數據。 用於監測活動的信息來源包括死亡證明、醫療記錄、癌症登記、其他疾病登記(例如,出生缺陷登記、終末期腎病登記)、職業暴露登記、健康或殘疾保險記錄和工傷賠償記錄。

協會措施

流行病學試圖識別和量化影響疾病的因素。 在最簡單的方法中,將暴露於可疑因素的人的疾病發生率與未暴露的人的疾病發生率進行比較。 暴露與疾病之間關聯的程度可以用以下任一方式表示 絕對 or 相對的 條款。 (另見“案例研究:措施”).

絕對效應的衡量標準是 利率差異風險差異 (表 2)。 一種 率差 是一個速率減去第二個速率。 例如,如果接觸苯的工人的白血病發病率為每 72 萬人年 100,000 例,而未接觸苯的工人的白血病發病率為每 12 萬人年 100,000 例,那麼比率差異為每 60 萬人年 100,000 例。 一種 風險差異 是風險或累積發生率的差異,範圍從 -1 到 1。 

 


表 2. 隊列研究的關聯度量

 

 

案例

風險人年

每 100,000 的費率

外露

100

20,000

500

未曝光

200

80,000

250

Total

300

100,000

300

差價 (RD) = 500/100,000 - 250/100,000

= 250/100,000 每年

(146.06/100,000 - 353.94/100,000)*

比率(或相對風險)(RR)=  

暴露的歸因風險(ARe) = 100/20,000 - 200/80,000

= 250/100,000 每年

暴露的歸因風險百分比(ARe%)=

 人口歸因風險 (PAR) = 300/100,000 - 200/80,000

= 50/100,000 每年

人口歸因風險百分比 (PAR%) =

 * 括號中的 95% 置信區間是使用方框中的公式計算得出的。


 

相對影響 基於利率或風險措施的比率,而不是差異。 一種 比率 是一個人群中的比率與另一個人群中的比率。 比率也被稱為 風險比, 相對風險, 相對率發生率 死亡) 比率. 該度量是無量綱的,範圍從 0 到無窮大。 當兩組的比率相似時(即暴露沒有影響), 比率 等於統一 (1)。 增加風險的敞口會產生大於 0 的比率,而保護性因素會產生 1 到 XNUMX 之間的比率。 超額相對風險 是相對風險減 1。例如,1.4 的相對風險也可以表示為 40% 的超額相對風險。

在病例對照研究(也稱為病例參照研究)中,確定患有疾病的人(病例)和未患病的人(對照或參照物)。 比較兩組過去的暴露情況。 將成為暴露病例的機率與成為暴露對照的機率進行比較。 無法獲得暴露人群和未暴露人群的來源人口的完整計數,因此無法計算發病率。 相反,可以通過計算將暴露的案例與暴露的控件進行比較 相對機率,或 比值比 (表3)。 

 


表 3. 病例對照研究的相關性測量:暴露於木屑和鼻腔和鼻竇腺癌

 

 

案例

Controls

外露

18

55

未曝光

5

140

Total

23

195

 

相對優勢(優勢比)(OR)=

暴露的歸因風險百分比()=

人口歸因風險百分比 (PAR%) =

哪裡 = 暴露控制的比例 = 55/195 = 0.28

 

* 括號中的 95% 置信區間是使用背頁方框中的公式計算得出的。

資料來源:改編自 Hayes 等人。 1986.


 

相對效果測量比絕對測量更頻繁地用於報告關聯強度。 然而,絕對指標可以更好地表明協會對公共衛生的影響。 一種常見疾病(如心髒病)的相對小幅增加可能會影響更多的人(風險差異大)並且對公眾健康的影響大於罕見疾病(如肝臟血管肉瘤。

顯著性檢驗

統計顯著性檢驗通常對效應量度進行,以評估觀察到的效應與零假設(即無效應)不同的可能性。 雖然許多研究,特別是在生物醫學研究的其他領域,可能通過以下方式表達重要性 p 值, 流行病學研究通常呈現 置信區間 (CI)(也稱為 置信限度). 例如,95% 的置信區間是效果測量值的範圍,其中包括從研究數據中獲得的估計測量值以及包含真實值的概率為 95% 的值。 區間外的值被認為不太可能包括真實的效果測量值。 如果比率的 CI 包括單位,則被比較的組之間沒有統計顯著差異。

置信區間比單獨的 p 值更能提供信息。 p 值的大小由兩個原因中的一個或兩個決定。 關聯的度量(例如比率、風險差異)很大,或者研究的人群很大。 例如,在大量人群中觀察到的疾病發生率的微小差異可能會產生非常顯著的 p 值。 無法僅從 p 值確定大 p 值的原因。 然而,置信區間使我們能夠區分這兩個因素。 首先,效果的大小可以通過效果度量的值和區間包含的數字來辨別。 例如,風險比率越大,表明效果越強。 其次,人口規模影響置信區間的寬度。 具有統計不穩定估計值的小群體比較大群體產生更寬的置信區間。

選擇用於表達結果可變性(“統計顯著性”)的置信水平是任意的,但傳統上為 95%,對應於 0.05 的 p 值。 95% 的置信區間有 95% 的概率包含效果的真實度量。 偶爾會使用其他置信水平,例如 90%。

暴露可以是二分的(例如,暴露的和未暴露的),或者可能涉及多個暴露水平。 影響措施(即響應)可能因接觸程度而異。 評估 曝光反應 關係是解釋流行病學數據的重要部分。 動物研究中暴露-反應的類比是“劑量-反應”。 如果響應隨著暴露水平的增加而增加,則與未觀察到趨勢相比,關聯更有可能是因果關係。 評估暴露-反應關係的統計檢驗包括 Mantel 擴展檢驗和卡方趨勢檢驗。

標準化

為考慮除感興趣的主要暴露和疾病以外的因素,關聯措施可能是 標準化 通過分層或回歸技術。 分層意味著根據因素將人口分成同質組(例如,性別組、年齡組、吸煙組)。 計算每個層的風險比或優勢比,併計算風險比或優勢比的總體加權平均值。 這些總體值反映了主要暴露與疾病之間的關聯,並針對分層因素進行了調整,即與去除分層因素的影響的關聯。

A 標準化比率 (SRR) 是兩個標準化利率的比率。 換句話說,SRR 是特定層級比率的加權平均值,其中每個層級的權重是非暴露組或參照組的人時分佈。 如果使用相同的權重,則可以比較兩個或更多組的 SRR。 可以為 SRR 構建置信區間,就像比率一樣。

標準化死亡率 (SMR) 是特定年齡比率的加權平均值,其中權重(例如,處於風險中的人-時間)來自研究組,比率來自參考人群,這與 SRR 中的情況相反。 通常的參考人群是一般人群,其死亡率可能很容易獲得併且基於大量數據,因此比使用來自非暴露隊列或研究中的職業人群亞組的死亡率更穩定。 使用隊列而不是參考人群的權重稱為間接標準化。 SMR 是隊列中觀察到的死亡人數與預期人數的比率,基於參考人群的比率(該比率通常乘以 100 以供呈現)。 如果不存在關聯,則 SMR 等於 100。需要注意的是,由於比率來自參考人群,權重來自研究組,因此兩個或多個 SMR 往往不具有可比性。 這種不可比性在流行病學數據的解釋中經常被遺忘,並可能得出錯誤的結論。

健康工人效應

職業人群的總死亡率低於一般人群是很常見的,即使工人因工作場所暴露而導致特定死因的風險增加。 這種現象,稱為 健康工人效應,反映了這樣一個事實,即任何一組就業人員平均都可能比一般人群更健康,其中包括工人和因疾病和殘疾而無法工作的人。 一般人群的總體死亡率往往高於工人。 效果因死亡原因而異。 例如,它對癌症的重要性一般不如對慢性阻塞性肺病的重要性。 這樣做的一個原因是,大多數癌症很可能不會因為在較年輕的時候選擇工作/職業而對癌症有任何傾向。 特定工人群體中的健康工人效應往往會隨著時間的推移而減弱。

比例死亡率

有時無法獲得隊列的完整列表(即處於危險中的人時),並且只有關於隊列經歷的死亡或死亡的某些子集的信息(例如,退休人員和在職員工中的死亡,而不是工人中的死亡)在有資格領取養老金之前離職的人)。 人年的計算需要特殊的方法來處理人次評估,包括生命表方法。 如果沒有所有隊列成員的總人次信息,無論疾病狀態如何,都無法計算 SMR 和 SRR。 反而, 比例死亡率 (PMR) 可以使用。 PMR 是觀察到的特定原因導致的死亡人數與預期人數的比率,基於參考人群中特定原因導致的總死亡人數的比例乘以研究中的總死亡人數組,乘以 100。

因為所有原因導致的死亡比例總和必須等於 1 (PMR=100),所以一些 PMR 可能看起來過多,但實際上由於其他死亡原因的實際不足而被人為誇大。 同樣,一些明顯的缺陷可能僅僅反映了其他死因的實際過剩。 例如,如果空中殺蟲劑噴灑器因事故造成的實際死亡人數過多,則所有原因的 PMR 加起來等於 100 的數學要求可能會導致某些死亡原因出現不足,即使死亡率過高。 為了改善這一潛在問題,主要對癌症感興趣的研究人員可以計算出 比例癌症死亡率 (PCMR)。 PCMR 將觀察到的癌症死亡人數與預期人數進行比較,根據參考人群中感興趣的癌症的總癌症死亡人數(而非所有死亡人數)的比例乘以研究組的癌症死亡總人數,再乘以100. 因此,PCMR 不會受到非癌症死因異常(過度或不足)的影響,例如事故、心髒病或非惡性肺病。

可以更好地分析 PMR 研究 死亡率比值比 (MORs),本質上是分析數據,就好像它們來自病例對照研究一樣。 “對照”是被認為與所研究的暴露無關的所有死亡的子集中的死亡。 例如,如果研究的主要興趣是癌症,則可以計算死亡率比值比,比較癌症死亡中的暴露與心血管死亡中的暴露。 這種方法與 PCMR 一樣,避免了當一種死因的波動影響另一種死因的明顯風險時出現的 PMR 問題,僅僅是因為總體 PMR 必須等於 100。然而,控制死因的選擇是至關重要的. 如上所述,它們一定與暴露無關,但對於許多潛在的控制疾病,暴露與疾病之間可能存在的關係可能​​並不為人所知。

歸因風險

如果觀察到的暴露與疾病之間的關聯是因果關係,則可以使用一些措施來表達可歸因於暴露的疾病數量。 這 暴露的歸因風險 (ARe) 是暴露的疾病率減去未暴露的疾病率。 由於在病例對照研究中無法直接測量發病率,因此 ARe 僅可計算隊列研究。 一個相關的、更直觀的度量, 暴露的歸因風險百分比 (ARe%), 可以從任一研究設計中獲得。 增強現實e% 是暴露人群中可歸因於暴露的病例比例(公式見表 2 和表 3)。 增強現實e% 是比率(或優勢比)減去 1,除以比率(或優勢比),再乘以 100。

人口歸因風險 (PAR)和 人口歸因風險百分比 (PAR%),或 病因分數, 表示由暴露和未暴露的人組成的總人口中的疾病數量,如果觀察到的關聯是因果關係,則歸因於暴露。 PAR 可以從隊列研究中獲得(表 28.3),PAR% 可以在隊列研究和病例對照研究中計算(表 2 和表 3)。

代表性

已經描述了幾種風險度量。 每個都假定用於計算事件的基本方法,並將這些事件的代表分配給定義的組。 當比較不同研究的結果時,了解所使用的方法對於解釋任何觀察到的差異至關重要。

 

返回

星期二,01 March 2011 01:48

研究設計中的選項

流行病學家感興趣的是變量之間的關係,主要是暴露變量和結果變量。 通常,流行病學家想要確定疾病的發生是否與人群中特定物質(暴露)的存在有關。 研究這些關係的方式可能有很大差異。 人們可以識別所有暴露於該物質的人並跟踪他們以測量疾病的發病率,並將這種發病率與適當的未暴露人群中的疾病發生率進行比較。 或者,可以簡單地從暴露和未暴露的樣本中取樣,而無需對它們進行完整的列舉。 或者,作為第三種選擇,可以確定所有在規定時間段內患上某種疾病的人(“病例”)和一組合適的無病個體(病例源人群的樣本),並確定兩組之間的暴露模式是否不同。 研究參與者的隨訪是一種選擇(在所謂的縱向研究中):在這種情況下,暴露的發生和疾病發作之間存在時間滯後。 另一種選擇是人口的橫截面,在同一時間點測量暴露和疾病。

在本文中,重點關注常見的研究設計——隊列、案例參照(案例對照)和橫斷面研究。 為了為這個討論奠定基礎,考慮一個小鎮上的大型粘膠人造絲工廠。 一項關於接觸二硫化碳是否會增加心血管疾病風險的調查已經開始。 調查有幾種設計選擇,有些更明顯,有些則不太明顯。 第一個策略是確定所有接觸過二硫化碳的工人,並跟踪他們的心血管死亡率。

隊列研究

隊列研究包括研究參與者分享一個共同的事件,暴露。 經典的隊列研究確定了一組明確的暴露人群,然後對每個人進行隨訪並記錄他們的發病率和/或死亡率經歷。 除了共同的定性暴露外,隊列還應根據其他定義 資格標準,例如年齡範圍、性別(男性或女性或兩者)、最短暴露持續時間和強度、免於其他暴露等,以提高研究的有效性和效率。 根據用於測量疾病的經驗標準集,在入口處,所有隊列成員都應該沒有正在研究的疾病。

例如,如果在關於二硫化碳對冠心病發病率影響的隊列研究中,冠心病根據經驗被測量為臨床梗塞,則那些在基線時有冠狀動脈梗塞病史的人必須被排除在隊列之外。 相比之下,沒有梗死病史的心電圖異常是可以接受的。 然而,如果新的心電圖變化的出現是實證結果測量,隊列成員在基線時也應該有正常的心電圖。

應將暴露隊列的發病率(以發病率表示)或死亡率與參考隊列進行比較,參考隊列理想情況下應與暴露隊列在所有相關方面盡可能相似,除了暴露,以確定相對風險因暴露而生病或死亡。 使用類似但未暴露的隊列作為參考經驗的提供者比將暴露隊列的發病率或死亡率與年齡標準化的國家數據進行比較的常見(錯誤)做法更可取,因為一般人群甚至無法滿足最比較有效性的基本要求。 由這種比較得出的標準化發病率(或死亡率)比 (SMR) 通常會低估真實風險比,因為暴露隊列中存在偏差,導致兩個人群之間缺乏可比性。 這種比較偏差被命名為“健康工人效應”。 然而,這實際上不是真正的“影響”,而是來自負面混雜的偏差,而負面混雜又是由就業人群中的健康選擇性人員流動引起的。 (健康狀況不佳的人往往會離開或永遠不會進入“暴露”人群,他們的最終目的地通常是普通人群中的失業部分。)

因為“暴露”隊列被定義為有一定的暴露,只有 單次曝光造成的影響 (或混合暴露)可以同時研究。 另一方面,隊列設計允許研究 多種疾病同時發生. 還可以同時研究同一疾病的不同表現,例如心絞痛、ECG 變化、臨床心肌梗塞和冠狀動脈死亡率。 雖然非常適合檢驗特定假設(例如,“接觸二硫化碳會導致冠心病”),但一項隊列研究也可以回答更普遍的問題:“這種接觸會導致哪些疾病?”

例如,在一項調查鑄造工人死於肺癌風險的隊列研究中,死亡率數據來自國家死因登記冊。 雖然這項研究是為了確定鑄造廠粉塵是否會導致肺癌,但數據來源同樣努力地提供了所有其他死因的信息。 因此,可以同時研究其他可能的健康風險。

隊列研究的時間可以是回顧性的(歷史的)或前瞻性的(同期的)。 在這兩種情況下,設計結構是相同的。 在某個時間點或某個時間段對暴露人員進行全面計數,並通過定義的時間點對所有個人測量結果。 前瞻性和回顧性之間的區別在於研究的時間安排。 如果追溯,終點已經發生; 如果有希望,則必須等待。

在回顧性設計中,隊列是在過去的某個時間點定義的(例如,那些在 1 年 1961 月 1961 日接觸過的人,或者那些在 1970 年至 XNUMX 年之間從事接觸過工作的人)。 的發病率和/或死亡率 所有隊列成員 然後一直延續到現在。 雖然“全部”意味著離職人員也必須被追踪,但實際上很難達到 100% 的覆蓋率。 然而,隨訪越完整,研究就越有效。

在前瞻性設計中,隊列是在當前或未來某個時期定義的,然後將發病率追踪到未來。

在進行隊列研究時,必須留出足夠的時間進行隨訪,以便關注的終點有足夠的時間體現出來。 有時,因為過去的歷史記錄可能只有很短的一段時間,所以還是希望利用這個數據源,因為這意味著在研究結果可以被使用之前需要更短的前瞻性隨訪。可用的。 在這些情況下,回顧性和前瞻性隊列研究設計的組合可能是有效的。 表 1 顯示了呈現隊列數據的頻率表的總體佈局。

表 1. 呈現隊列數據的頻率表的總體佈局

發病率的組成部分

暴露隊列

未暴露隊列

疾病或死亡病例

c1

c0

隊列人數

N1

N0

 

暴露隊列中觀察到的患病比例計算如下:

參考隊列為:

比率則表示為:

N0N1 通常以人-時單位而不是人數來表示 人口。 人年分別為每個人計算。 不同的人經常在一段時間內進入隊列,而不是在同一天。 因此,他們的隨訪時間從不同的日期開始。 同樣,在他們去世後,或在相關事件發生後,他們不再“處於危險之中”,不應繼續為分母貢獻人年。

如果 RR 大於 1,則暴露隊列的發病率高於參考隊列,反之亦然。 RR 是一個點估計值,應為其計算置信區間 (CI)。 研究規模越大,置信區間就越窄。 如果 RR = 1 未包含在置信區間內(例如,95% CI 為 1.4 至 5.8),則結果可被視為在所選概率水平(在此示例中,α = 0.05)下“具有統計顯著性”。

如果以一般人群作為參考人群, c0 被“預期”數字取代, E(c1 ),源自該人群的年齡標準化發病率或死亡率(即,如果未發生感興趣的暴露,隊列中可能發生的病例數)。 這產生了標準化死亡率(或發病率)比率,SMR。 因此,

同樣對於 SMR,應計算置信區間。 最好在出版物中給出此度量而不是 p 值,因為如果一般人群是參考類別,統計顯著性檢驗就沒有意義。 這種比較會帶來相當大的偏差( 健康工人效應 上面提到的)和統計顯著性檢驗,最初是為實驗研究而開發的,在存在系統誤差的情況下會產生誤導。

假設問題是石英粉塵是否會導致肺癌。 通常,石英粉塵與其他致癌物質一起出現,例如礦山中的氡子體和柴油機尾氣,或鑄造廠中的多環芳烴。 花崗岩採石場不會讓石材工人接觸這些其他致癌物。 因此,最好在花崗岩採石場僱用的石材工人中研究這個問題。

然後假設所有 2,000 名工人在 20 年至 1951 年期間受僱於 1960 個採石場,並被納入該隊列,並且他們的癌症發病率(或者僅死亡率)從第一次暴露後的十年開始被跟踪(以允許誘導時間)並且結束於 1990 年。這是對 20 名採石場工人的癌症死亡率(或發病率)進行 30 到 25 年(取決於進入年份)或者說平均 1,000 年的隨訪特別是花崗岩工人。 必須記錄每個群組成員的暴露史。 必須追踪那些​​離開採石場的人,並記錄他們後來的接觸史。 在所有居民都有唯一登記號碼的國家,這是一個簡單的程序,主要受國家數據保護法的約束。 如果不存在此類系統,追踪員工以進行跟進可能會非常困難。 在存在適當的死亡或疾病登記處的情況下,可以從國家死因登記處獲得所有原因、所有癌症和特定癌症部位的死亡率。 (對於癌症死亡率,國家癌症登記處是更好的來源,因為它包含更準確的診斷。此外,還可以獲得發病率(或發病率)數據。)死亡率(或癌症發病率)可以與“預期數字”,以暴露隊列的人年為基礎,根據國家比率計算得出。

假設隊列中發現 70 例肺癌致死病例,而預期數(如果沒有暴露,本應發生的數)為 35。那麼:

c1 = 70, E(c1) = 35

因此,SMR = 200,這表明暴露者死於肺癌的風險增加了兩倍。 如果可以獲得詳細的暴露數據,則可以研究癌症死亡率與不同潛伏時間(例如 10、15、20 年)、不同類型採石場(不同種類的花崗岩)、不同歷史時期、不同暴露的函數的關係強度等。 但是,70個案例不能再細分太多,因為分到每一類的數量很快就變得太少了,無法進行統計分析。

兩種類型的群組設計各有優缺點。 通常,回顧性研究只能衡量死亡率,因為通常缺乏較輕微表現的數據。 癌症登記處是一個例外,也許還有其他一些登記處,例如中風登記處和出院登記處,因為發病率數據也是可用的。 評估過去的暴露始終是一個問題,並且在回顧性研究中暴露數據通常相當薄弱。 這會導致效果掩蔽。 另一方面,由於病例已經發生,研究結果出來的時間要快得多; 比方說,兩到三年。

可以更好地規劃前瞻性隊列研究以符合研究人員的需要,並且可以準確和系統地收集暴露數據。 可以測量疾病的幾種不同表現。 暴露和結果的測量都可以重複,所有測量都可以標準化,並且可以檢查它們的有效性。 但是,如果疾病潛伏期較長(如癌症),則需要經過很長時間——甚至20到30年——才能得出研究結果。 這段時間可能會發生很多事情。 例如,研究人員的更替、用於測量選擇用於研究的植物的暴露、重塑或關閉等技術的改進。 所有這些情況都會危及研究的成功。 前瞻性研究的費用通常也高於回顧性研究,但這主要是因為測量次數多得多(重複暴露監測、臨床檢查等),而不是因為死亡登記費用更高。 因此 每單位信息的成本 不一定超過回顧性研究。 綜上所述,前瞻性研究更適合潛伏期較短、隨訪時間短的疾病,而回顧性研究更適合潛伏期長的疾病。

病例對照(或病例參考)研究

讓我們回到粘膠人造絲工廠。 如果暴露工人的名冊丟失,則回顧性隊列研究可能不可行,而前瞻性隊列研究將在很長一段時間內產生良好的結果。 然後,另一種方法是比較在規定時間段內鎮上死于冠心病的人與同一年齡組總人口的樣本。

經典的病例對照(或病例參照)設計基於從動態(開放,以成員更替為特徵)人群中抽樣。 這個人口可以是整個國家、一個地區或一個城市的人口(如我們的示例),也可以是行政上定義的患者入院人口。 定義的群體提供了案例和對照(或參考對象)。

該技術是收集所有存在於某個地點的相關疾病病例。 關鍵 及時(普遍情況),或在規定的時間內發生 時間(事件案例)。 因此,病例可以從發病率或死亡率登記處提取,或者直接從醫院或具有有效診斷的其他來源收集。 控件被繪製為 樣品 來自同一人群,無論是來自非病例還是來自整個人群。 另一種選擇是 選擇 患有另一種疾病的患者作為對照,但這些患者必須代表病例所來自的人群。 每種情況可能有一個或多個對照(即參照物)。 抽樣方法不同於隊列研究,隊列研究檢查整個人群。 不用說,病例對照設計在降低成本方面的收益是相當可觀的,但重要的是樣本是 代表 案例來源的整個人群(即“研究基礎”)——否則研究可能存在偏差。

確定病例和對照後,通過問卷調查、訪談或在某些情況下從現有記錄(例如,可以從中推斷出工作經歷的工資單記錄)收集他們的暴露歷史。 這些數據可以從參與者本人那裡獲得,如果他們已經去世,也可以從他們的近親那裡獲得。 為確保對稱回憶,重要的是死亡和活著的病例和參考對象的比例相等,因為近親通常提供的暴露史不如參與者本身詳細。 將病例中的暴露模式信息與對照組中的暴露模式信息進行比較,提供對 比值比 (或),間接措施的 暴露人群中患病的風險 相對於未曝光的。

因為病例對照設計依賴於從患有某種疾病的患者(即病例)以及來自病例起源人群的非患病人群樣本(即對照)中獲得的暴露信息,所以與暴露的聯繫只能調查 一種病. 相比之下,該設計允許同時研究 幾個不同的曝光. 案例參照研究非常適合解決具體的研究問題(例如,“接觸二硫化碳會導致冠心病嗎?”),但它也有助於回答更普遍的問題:“哪些接觸會導致這種疾病?

歐洲提出了接觸有機溶劑是否會導致原發性肝癌的問題(例如)。 原發性肝癌的病例在歐洲是一種相對罕見的疾病,最好從國家癌症登記處收集。 假設三年內發生的所有癌症病例構成病例係列。 然後,該研究的人口基數是對相關歐洲國家的全部人口進行為期三年的跟踪調查。 對照是作為來自同一人群的未患肝癌的人的樣本抽取的。 為方便起見(意味著同一來源可用於對對照進行取樣),與溶劑暴露無關的另一種癌症類型的患者可用作對照。 結腸癌與溶劑接觸沒有已知關係; 因此,這種癌症類型可以包括在對照中。 (使用癌症對照可最大限度地減少回憶偏差,因為病例和對照給出的病史的準確性平均而言是對稱的。但是,如果後來揭示了結腸癌與接觸溶劑之間目前未知的某些聯繫,則這種類型的對照會導致對真正風險的低估——而不是誇大。)

對於每個肝癌病例,繪製了兩個對照以獲得更大的統計功效。 (可以繪製更多的控件,但可用資金可能是一個限制因素。如果資金不受限制,也許多達四個控件將是最佳的。超過四個,收益遞減法則適用。)從數據中獲得適當的許可後通常通過郵寄問卷的方式聯繫保護當局、病例和控制人員或其近親,要求提供詳細的職業歷史,特別強調按時間順序排列的所有雇主、工作部門、工作任務在不同的就業,以及在每個任務各自的就業期限。 這些數據很難從親戚那裡獲得; 然而,具體的化學品或商品名稱通常不會被親屬很好地回憶起來。 調查問卷還應包括有關可能的混雜數據的問題,例如飲酒、接觸含黃曲霉毒素的食物以及乙型和丙型肝炎感染。 為了獲得足夠高的回复率,每隔三周向未回复者發送兩次提醒。 這通常會導致最終響應率超過 70%。 然後由工業衛生學家在不知道受訪者的病例或控制狀態的情況下審查職業史,並將暴露分為高、中、低、無和未知的溶劑暴露。 癌症診斷前的十年暴露被忽略了,因為如果潛伏時間那麼短,引髮劑型致癌物可能是癌症的原因,這在生物學上是不合理的(儘管促進劑,事實上,可以)。 在此階段,還可以區分不同類型的溶劑暴露。 因為已經給出了完整的工作經歷,所以也可以探索其他暴露,儘管最初的研究假設不包括這些。 然後可以計算暴露於任何溶劑、特定溶劑、溶劑混合物、不同類別的暴露強度以及與癌症診斷相關的不同時間窗的比值比。 建議從分析中排除那些接觸未知的人。

可以對病例和對照進行取樣和分析 獨立系列 or 匹配組. 匹配意味著根據某些特徵或屬性為每個案例選擇控件,以形成對(或集合,如果為每個案例選擇多個控件)。 匹配通常基於一個或多個這樣的因素來完成,例如年齡、生命狀況、吸煙史、病例診斷的日曆時間等。 在我們的示例中,病例和對照會根據年齡和生命狀況進行匹配。 (生命狀態很重要,因為患者自己通常比近親提供更準確的暴露史,並且出於有效性原因,對稱性是必不可少的。)今天,建議對匹配進行限制,因為此過程可能會引入負面(效應掩蔽) )混雜。

如果一個控件與一個案例匹配,則該設計稱為 配對設計. 如果研究更多對照的成本不至於令人望而卻步,那麼每個案例中不止一個參考對象會提高 OR 估計值的穩定性,從而使研究規模效率更高。

不匹配病例對照研究的結果佈局如表 2 所示。

表 2. 病例對照數據的樣本佈局

曝光分類

 

外露

未曝光

案例

c1

c0

非個案

n1

n0

 

從該表中,可以計算出病例之間的暴露機率和人群(對照組)之間的暴露機率,並將其除以產生暴露機率比 OR。 對於這些情況,暴露機率是 c1 / c0,對於控件來說,它是 n1 / n0. OR 的估計是:

如果暴露的案例比對照多,則 OR 超過 1,反之亦然。 必須以與 RR 相同的方式為 OR 計算和提供置信區間。

再舉一個例子,一家大公司的職業健康中心為 8,000 名暴露於各種粉塵和其他化學試劑的員工提供服務。 我們對混合粉塵暴露與慢性支氣管炎之間的聯繫感興趣。 該研究包括對該人群進行為期一年的隨訪。 我們將慢性支氣管炎的診斷標准定為“連續兩年晨咳、咳痰三個月”。 在研究開始之前定義“陽性”粉塵暴露的標準。 在一年期間訪問健康中心並滿足這些標準的每位患者都是一個案例,而下一位因非肺部問題尋求醫療建議的患者被定義為對照。 假設在研究期間登記了 100 個病例和 100 個對照。 將 40 個案例和 15 個對照歸類為已暴露於灰塵。 然後

c1 = 40, c0 = 60, n1 = 15,和 n0 = 85。

因此,

在前面的例子中,沒有考慮混雜的可能性,混雜可能由於年齡等變量中病例和對照之間的系統差異而導致OR的失真。 減少這種偏差的一種方法是將控制與年齡或其他可疑因素的病例相匹配。 這導致表 3 中描述的數據佈局。

表 3. 如果一個對照與每個病例匹配,則病例對照數據的佈局

參照物

案例

曝光 (+)

接觸 (-)

曝光 (+)

f+ +

f+ -

接觸 (-)

f- +

f- -

 

重點分析不一致對:即“案例暴露,控制未暴露” (f+–); 和“案例未曝光,控制曝光” (f–+). 當一對中的兩個成員都暴露或未暴露時,該對將被忽略。 配對研究設計中的 OR 定義為

在一項關於鼻癌與木屑暴露之間關聯的研究中,總共有 164 對病例對照。 只有一對,外殼和控件都暴露了,而在 150 對中,外殼和控件都沒有暴露。 不進一步考慮這些對。 外殼(但不是對照)暴露在 12 對中,而對照(但不是外殼)暴露在一對中。 因此,

由於此區間中不包含單位,因此結果具有統計顯著性——也就是說,鼻癌與木屑暴露之間存在統計顯著相關性。

病例對照研究比隊列研究更有效 疾病很少見; 他們實際上可能提供唯一的選擇。 然而,常見疾病也可以通過這種方法進行研究。 如果 很少曝光, 基於暴露的隊列是首選或唯一可行的流行病學設計。 當然,也可以對常見暴露進行隊列研究。 當暴露和疾病都很常見時,隊列和病例對照設計之間的選擇通常是在考慮有效性的情況下決定的。

由於病例對照研究依賴於回顧性暴露數據,通常基於參與者的回憶,其弱點是暴露信息的不准確和粗糙,導致效應掩蔽通過 非微分 (對稱)暴露狀態的錯誤分類。 此外,有時病例和對照之間的回憶可能不對稱,病例通常被認為記得“更好”(即回憶偏差)。

選擇性回憶會導致效果放大偏差 微分 (不對稱)暴露狀態的錯誤分類。 病例對照研究的優勢在於它們的成本效益和能夠相對快速地提供問題解決方案的能力。 由於抽樣策略,它們允許調查非常大的目標人群(例如,通過國家癌症登記處),從而提高研究的統計能力。 在數據保護立法或缺乏良好的人口和發病率登記阻礙隊列研究執行的國家,以醫院為基礎的病例對照研究可能是進行流行病學研究的唯一實用方法。

隊列中的病例對照抽樣(巢式病例對照研究設計)

隊列研究也可以設計為抽樣而不是完整的隨訪。 這種設計以前被稱為“嵌套”病例對照研究。 隊列中的抽樣方法對隊列資格設置了不同的要求,因為現在比較是在同一隊列中進行的。 因此,這不僅應包括接觸嚴重的工人,還應包括接觸較少甚至未接觸的工人,以便提供 曝光對比 本身內。 在組裝隊列時,重要的是要意識到資格要求的這種差異。 如果首先對符合“大量”暴露條件的隊列進行完整隊列分析,然後再對同一隊列進行“巢式”病例對照研究,則該研究將變得不敏感。 這引入了效應掩蔽,因為由於隊列成員之間的暴露經驗缺乏可變性,暴露對比“按設計”不足。

然而,如果隊列具有廣泛的暴露經驗,那麼嵌套病例對照方法就非常有吸引力。 一個人收集了隊列中在隨訪期間出現的所有病例以形成病例係列,而只有一個 樣品 的非案例是為控制系列繪製的。 然後,與傳統的病例對照設計一樣,研究人員通過採訪病例和對照(或他們的近親),通過仔細檢查雇主的人員名單,通過構建 工作接觸矩陣,或通過組合這些方法中的兩種或多種。 控件可以與案例匹配,也可以將它們視為一個獨立的系列。

與隊列中每個成員的詳盡信息採購相比,抽樣方法的成本更低。 特別是,因為只研究了一個控製樣本,更多的資源可以用於對每個案例和控制進行詳細和準確的暴露評估。 然而,與經典隊列研究中相同的統計功效問題普遍存在。 為了獲得足夠的統計能力,隊列必須始終包含“足夠”數量的暴露病例,具體取決於應檢測到的風險程度。

橫斷面研究設計

從科學意義上講,橫截面設計是研究人群的橫截面,沒有考慮時間。 暴露和發病率(患病率)都是在同一時間點測量的。

從病因學的角度來看,這項研究設計薄弱,部分原因是它處理的是患病率而不是發病率。 患病率是一項綜合指標,取決於疾病的發病率和持續時間。 這也限制了橫斷面研究對持續時間長的疾病的使用。 更嚴重的是,由於依賴於健康從暴露組中排除對暴露影響更敏感的那些人,造成了強烈的負面偏見。 因此,病因問題最好通過縱向設計來解決。 實際上,橫斷面研究無法得出關於暴露是否先於疾病或相反的結論。 僅當暴露與結果之間存在真實時間關係時,橫截面才具有病因學意義,這意味著當前暴露必須具有即時影響。 然而,可以對暴露進行橫截面測量,以便它代表過去較長的時間段(例如,血鉛水平),而結果測量是流行率之一(例如,神經傳導速度)。 因此,該研究是縱向和橫斷面設計的混合體,而不僅僅是研究人群的橫斷面。

橫斷面描述性調查

橫斷面調查通常對實踐和管理而非科學目的有用。 流行病學原理可應用於職業衛生環境中的系統監測活動,例如:

  • 觀察與職業、工作區域或某些暴露有關的發病率
  • 對接觸已知職業危害的工人進行定期調查
  • 檢查接觸新的健康危害的工人
  • 生物監測計劃
  • 用於識別和量化危害的暴露調查
  • 不同工人群體的篩查計劃
  • 評估需要預防或定期控制(如血壓、冠心病)的工人比例。

 

為所有類型的調查選擇具有代表性、有效和具體的發病率指標非常重要。 與臨床診斷相比,一項調查或篩選程序只能使用相當少的測試,因此篩選測試的預測價值很重要。 不敏感的方法無法檢測到感興趣的疾病,而高度敏感的方法會產生太多的假陽性結果。 在職業環境中篩查罕見病是不值得的。 所有病例發現(即篩查)活動還需要一種機制來照顧那些在診斷和治療方面有“陽性”發現的人。 否則只會導致挫敗感,並可能弊大於利。

 

返回

星期二,01 March 2011 02:17

研究設計中的有效性問題

有效性的需要

流行病學旨在提供對人群疾病經歷的理解。 特別是,它可以用來深入了解健康不佳的職業原因。 這些知識來自對患有疾病的人群進行的研究,通過將他們與沒有這種疾病的人進行比較。 另一種方法是檢查從事特定工作並有特定暴露的人會患上哪些疾病,並將這些疾病模式與沒有類似暴露的人的疾病模式進行比較。 這些研究提供了特定暴露的疾病風險估計。 為了將來自此類研究的信息用於製定預防計劃、識別職業病以及為那些受到暴露影響的工人提供適當補償,這些研究必須是有效的。

合法性 可以定義為一項研究反映真實情況的能力。 因此,一項有效的研究能夠正確衡量暴露與疾病之間的關聯(陽性、陰性或缺失)。 它描述了真實風險的方向和大小。 有效性分為兩種類型:內部有效性和外部有效性。 內部效度是一項研究反映研究對象之間真實情況的能力; 外部有效性反映了人口中可能發生的情況。

有效性與測量的真實性有關。 有效性必須與測量精度區分開來,後者是研究規模和研究設計效率的函數。

內部有效性

當一項研究沒有偏見時,據說它是內部有效的,因此真實反映了研究參與者中存在的暴露與疾病之間的關聯。 觀察到的與暴露相關的疾病風險可能確實來自真實的關聯,因此是有效的,但它也可能反映了偏見的影響。 偏見會給現實帶來扭曲的形象。

三種主要類型的偏見,也稱為 系統誤差,通常區分為:

  • 選擇偏見
  • 信息或觀察偏差
  • 混雜

 

下面將使用職業健康環境中的示例簡要介紹它們。

選擇偏見

當進入研究受到潛在研究參與者的暴露狀態知識的影響時,就會發生選擇偏倚。 因此,只有當該人進入研究時(之前)疾病已經發生時,才會遇到這個問題。 通常,在流行病學環境中,這將發生在病例對照研究或回顧性隊列研究中。 這意味著,如果已知某人已被暴露,則他或她將更有可能被視為病例。 三組情況可能導致此類事件,這也取決於疾病的嚴重程度。

自我選擇偏差

當知道自己過去曾接觸過已知或認為有害的產品並且確信自己的疾病是接觸的結果的人會諮詢醫生以了解其他未接觸過的人可能忽略的症狀時,就會發生這種情況。 對於幾乎沒有明顯症狀的疾病,這種情況尤其容易發生。 一個例子可能是處理用於癌症治療的藥物的女護士早孕流產或自然流產。 這些女性比大多數女性更了解生殖生理學,並且由於擔心她們生育孩子的能力,可能更有可能識別或標記為自然流產,而其他女性只會將其視為月經延遲。 羅斯曼 (Rothman, 1986) 引用的一項回顧性隊列研究的另一個例子涉及美國疾病控制中心對在內華達州進行的美國原子彈試驗期間在場的士兵進行的白血病研究。 在試驗場上的部隊中,有 76% 被追踪並構成了隊列。 其中,82% 是由調查人員發現的,但另有 18% 的人在聽到有關該研究的宣傳後親自聯繫了調查人員。 CDC 追踪到的 82% 中有 18 例白血病病例,XNUMX% 中有 XNUMX 例是自訴的。 這有力地表明,研究人員識別暴露人員的能力與白血病風險有關。

診斷偏差

當醫生一旦知道患者之前接觸過什麼,就更有可能診斷出特定疾病時,就會發生這種情況。 例如,當大多數油漆是含鉛的時,一種稱為周圍神經炎伴麻痺的周圍神經疾病症狀也被稱為畫家的“腕骨下垂”。 了解患者的職業使得即使在早期階段也更容易診斷疾病,而對於不知道職業暴露於鉛的研究參與者來說,識別病原體會困難得多。

拒絕參與研究導致的偏見

當人們(無論是健康的還是生病的)被要求參加一項研究時,有幾個因素會影響他們是否同意。 是否願意回答冗長的問卷,這些問卷有時會詢問敏感問題,甚至更願意提供血液或其他生物樣本,這可能取決於個人的自利程度。 意識到過去潛在接觸的人可能準備好接受這項調查,希望這有助於找到疾病的原因,而認為自己沒有接觸過任何危險的東西或不感興趣的人在知道的情況下,可以拒絕參加研究的邀請。 這可以導致選擇那些最終將成為研究參與者的人,而不是所有可能已經成為研究參與者的人。

信息偏差

這也稱為觀察偏差,關注隨訪研究中的疾病結果和病例對照研究中的暴露評估。

前瞻性隨訪(隊列)研究中的差異結果評估

在研究開始時定義了兩組:暴露組和未暴露組。 如果這兩組之間的病例搜索不同,就會出現診斷偏差問題。 例如,考慮在給定行業中暴露於二噁英意外釋放的一群人。 對於高暴露人群,建立了積極的隨訪製度,定期進行醫學檢查和生物監測,而其餘的工作人群僅接受常規護理。 在密切監測下的人群中很可能會發現更多疾病,這將導致對風險的潛在高估。

回顧性隊列研究中的差異損失

在回顧性隊列研究中可能會出現與上一段中描述的機制相反的機制。 在這些研究中,通常的處理方法是從過去在特定行業就業的所有人的檔案開始,然後評估就業後的疾病或死亡率。 不幸的是,在幾乎所有的研究中,檔案都是不完整的,而且一個人失踪的事實可能與暴露狀態或疾病狀態或兩者有關。 例如,在最近對接觸芳香胺的化學工業工人進行的一項研究中,在一組 777 名接受過尿路腫瘤細胞學篩查的工人中發現了 34 個腫瘤。 總共只有 4.4 條記錄丟失,相當於暴露評估文件丟失了 25%,但對於膀胱癌病例,XNUMX 例中有 XNUMX 例丟失了暴露數據,即 XNUMX%。 這表明,成為案件的人的檔案比其他工人的檔案更容易丟失。 這可能是由於公司內部更頻繁的工作變動(這可能與曝光效應有關)、辭職、解僱或純屬偶然。

病例對照研究中暴露的差異評估

在病例對照研究中,疾病在研究開始時已經發生,將尋求有關過去暴露的信息。 偏見可能來自採訪者或研究參與者對調查的態度。 信息通常由訓練有素的採訪者收集,他們可能知道也可能不知道研究背後的假設。 例如,在高度工業化地區進行的一項基於人群的膀胱癌病例對照研究中,研究人員可能很清楚某些化學物質(例如芳香胺)是膀胱癌的危險因素。 如果他們還知道誰患了這種疾病,誰沒有患上這種疾病,他們可能會對患有膀胱癌的參與者進行比對對照組更深入的採訪。 他們可能會堅持提供過去職業的更詳細信息,系統地搜索接觸芳香胺的情況,而對於控制,他們可能會以更常規的方式記錄職業。 由此產生的偏差被稱為 暴露懷疑偏差.

參與者自己也可能對這種偏見負責。 這就是所謂的 回憶偏差 以區別於面試官的偏見。 兩者都有曝光懷疑作為偏見的機制。 生病的人可能會懷疑他們的疾病是由職業引起的,因此會盡可能準確地記住他們可能接觸過的所有危險因素。 在處理未定義產品的情況下,他們可能傾向於回憶精確化學品的名稱,尤其是在向他們提供可疑產品清單的情況下。 相比之下,控件可能不太可能經歷相同的思維過程。

混淆

當在暴露和疾病之間觀察到的關聯部分是研究中暴露的影響與另一個因素混合的結果時,就會存在混雜。 比方說,我們發現焊工患肺癌的風險增加了。 我們很想立即得出結論,接觸焊接煙霧與肺癌之間存在因果關係。 然而,我們也知道吸煙是迄今為止肺癌的主要危險因素。 因此,如果有可用信息,我們將開始檢查焊工和其他研究參與者的吸煙狀況。 我們可能會發現焊工比非焊工更容易吸煙。 在這種情況下,已知吸煙與肺癌有關,同時,在我們的研究中,吸煙也被發現與焊工有關。 用流行病學術語來說,這意味著吸煙與肺癌和焊接有關,正在混淆焊接與肺癌之間的關聯。

交互或效果修改

與上面列出的所有問題,即選擇、信息和混雜這些偏差相比,交互作用不是由於研究設計或分析問題而導致的偏差,而是反映了現實及其複雜性。 這種現象的一個例子如下:接觸氡是肺癌的危險因素,吸煙也是如此。 此外,吸煙和氡暴露對肺癌風險的影響也不同,這取決於它們是共同作用還是單獨作用。 大多數關於這個主題的職業研究都是在地下礦工中進行的,有時會提供相互矛盾的結果。 總的來說,似乎存在支持吸煙和氡暴露相互作用導致肺癌的論點。 這意味著肺癌風險會因接觸氡而增加,即使在非吸煙者中也是如此,但吸煙者因氡而增加的風險比非吸煙者大得多。 在流行病學術語中,我們說效果是乘法的。 與上述混雜相反,相互作用需要在分析中仔細分析和描述,而不是簡單地控制,因為它反映了生物學水平上發生的事情,而不僅僅是糟糕的研究設計的結果。 它的解釋導致對研究結果的更有效解釋。

外部有效性

只有確保內部有效性得到保障後,才能解決此問題。 如果我們確信研究中觀察到的結果反映了真實的關聯,我們可以問自己是否可以將這些結果外推到研究參與者本身所在的更大人群,甚至是其他相同的人群或者至少非常相似。 最常見的問題是針對男性獲得的結果是否也適用於女性。 多年來,研究,特別是職業流行病學調查一直只在男性中進行。 1960 年代和 1970 年代在美國、英國和瑞典對化學家進行的研究都發現特定癌症(即白血病、淋巴瘤和胰腺癌)的風險增加。 根據我們對接觸溶劑和其他一些化學物質的影響的了解,我們當時已經可以推斷出實驗室工作也對女性有致癌風險。 事實上,當第一項針對女性化學家的研究最終於 1980 世紀 XNUMX 年代中期發表時,情況就是如此,該研究發現的結果與男性相似。 值得注意的是,發現的其他多發癌症是乳腺癌和卵巢癌,傳統上認為它們僅與內源性因素或生殖有關,但最近懷疑殺蟲劑等環境因素可能對其起作用。 在女性癌症的職業決定因素方面需要做更多的工作。

有效研究的策略

永遠不會存在完全有效的研究,但研究人員有責任盡量避免或至少盡量減少偏差。 這通常最好在研究設計階段完成,但也可以在分析期間進行。

學習規劃

只有通過仔細設計流行病學研究和嚴格執行所有後續的日常指導方針,包括對現場條件下研究的質量保證的一絲不苟的關注,才能避免選擇和信息偏差。 混淆可以在設計或分析階段處理。

選擇

必須明確定義將參與者視為案例的標準。 人們不能或至少不應該嘗試研究定義不明確的臨床狀況。 將暴露知識可能對疾病評估產生的影響降至最低的一種方法是只包括那些無論患者病史的任何信息都會被診斷出來的嚴重病例。 在癌症領域,研究通常僅限於具有疾病組織學證據的病例,以避免納入臨界病變。 這也意味著被研究的群體是明確定義的。 例如,在癌症流行病學中眾所周知,給定器官內不同組織學類型的癌症可能具有不同的風險因素。 如果病例數足夠,最好將肺腺癌與肺鱗癌區分開來。 無論進入研究的最終標準是什麼,都應該明確定義和描述。 例如,應使用國際疾病分類 (ICD) 指明疾病的確切代碼,對於癌症,應使用國際疾病分類-腫瘤學 (ICD-O)。

一旦指定了標準,就應努力最大限度地參與研究。 拒絕參與的決定幾乎從來都不是隨機做出的,因此會導致偏見。 研究應該首先呈現給看病的臨床醫生。 需要他們的批准才能接近患者,因此必須說服他們支持這項研究。 一個經常具有說服力的論點是,這項研究符合公眾健康的利益。 然而,在這個階段最好不要討論正在評估的確切假設,以避免對相關臨床醫生產生不當影響。 不應要求醫師承擔補充職責; 如果研究調查者提供手段來執行研究所需的常規護理之外的任何額外任務,則更容易說服衛生人員支持研究。 採訪者和數據提取者不應該了解他們患者的疾病狀況。

對提供給參與者的信息也應給予類似的關注。 研究的目標必須以寬泛、中立的方式描述,但也必須具有說服力和說服力。 重要的是,在避免使用醫學術語的同時,充分理解公共衛生的保密性和利益問題。 在大多數情況下,使用財務或其他激勵措施被認為是不合適的,儘管應為參與者可能產生的任何費用提供補償。 最後但並非最不重要的一點是,普通民眾應該具備足夠的科學素養,以了解此類研究的重要性。 必須向每個潛在參與者解釋參與的好處和風險,他們需要完成調查問捲和/或提供生物樣本進行存儲和/或分析。 在獲得事先和充分知情的同意時不應施加脅迫。 如果研究完全基於記錄,則必須獲得負責確保此類記錄機密性的機構的事先批准。 在這些情況下,通常可以放棄個人參與者的同意。 相反,工會和政府官員的批准就足夠了。 流行病學調查不會對個人的私生活構成威脅,而是對改善人群健康的潛在幫助。 在進行研究之前,需要機構審查委員會(或倫理審查委員會)的批准,並且他們期望上述大部分內容供他們審查。

資訊

在前瞻性後續研究中,暴露和未暴露參與者的疾病或死亡率狀態評估方法必須相同。 特別是,不應使用不同的來源,例如只檢查非暴露參與者的中央死亡登記冊,以及對暴露參與者使用強化主動監測。 同樣,必須以嚴格可比的方式獲得死因。 這意味著,如果一個系統被用來為未暴露的人群(通常是普通人群)獲取官方文件,那麼就永遠不應該計劃通過醫療記錄或對參與者本人或其家人的訪談來獲得更精確的信息。暴露的子組。

在回顧性隊列研究中,應努力確定研究人群與感興趣人群的比較接近程度。 人們應該通過使用有關人口構成的各種來源來提防暴露組和非暴露組的潛在差異損失。 例如,將工資單列表與工會會員列表或其他專業列表進行比較可能很有用。 必須協調差異,必須嚴格遵守研究採用的方案。

在病例對照研究中,存在其他選擇以避免偏倚。 採訪者、研究人員和研究參與者無需了解研究中的確切假設。 如果他們不知道正在測試的關聯,他們就不太可能嘗試提供預期的答案。 讓研究人員對研究假設一無所知實際上通常是非常不切實際的。 採訪者幾乎總是知道最有可能引起興趣的暴露,以及誰是個案,誰是對照。 因此,我們必須依靠他們的誠實以及他們在基礎研究方法方面的訓練,這應該是他們專業背景的一部分; 客觀性是科學各個階段的標誌。

不告知研究參與者研究的確切對象更容易。 關於收集數據以更好地了解健康和疾病的必要性的良好、基本的解釋通常就足夠了,並且將滿足倫理審查的需要。

混淆

混雜是唯一可以在研究設計階段或在提供足夠信息的情況下在分析階段處理的偏倚。 例如,如果年齡被認為是興趣關聯的潛在混雜因素,因為年齡與疾病風險相關(即,癌症在老年人中變得更頻繁)並且還與暴露(暴露條件隨年齡或與年齡相關的因素,如資格、工作職位和就業期限),存在幾種解決方案。 最簡單的方法是將研究限制在指定的年齡範圍內——例如,只招募 40 至 50 歲的白人男性。這將為簡單分析提供要素,但也有將結果的應用限制在單一人群的缺點性別年齡/種族群體。 另一種解決方案是按年齡匹配。 這意味著對於每個案例,都需要一個相同年齡的參照物。 這是一個很有吸引力的想法,但必須記住,隨著匹配因素數量的增加,滿足這一要求可能會很困難。 此外,一旦匹配了一個因素,就無法評估其在疾病發生中的作用。 最後一個解決方案是在研究數據庫中獲得關於潛在混雜因素的足夠信息,以便在分析中檢查它們。 這可以通過簡單的分層分析或使用更複雜的工具(例如多變量分析)來完成。 但是,應該記住,分析永遠無法彌補設計或實施不當的研究。

結論

流行病學研究中出現偏差的可能性由來已久。 當所研究的關聯很強(如吸煙和肺癌的情況)時,這並不是一個太大的問題,因此一些不准確不會導致太嚴重的問題。 然而,現在是評估較弱風險因素的時候了,對更好工具的需求變得至關重要。 這包括對優秀研究設計的需求,以及將各種傳統設計(如病例對照或隊列研究)的優勢與更創新的方法(如嵌套在隊列中的病例對照研究)相結合的可能性。 此外,生物標誌物的使用可以提供對當前和可能過去的暴露以及疾病早期階段進行更準確評估的方法。

 

返回

星期二,01 March 2011 02:20

隨機測量誤差的影響

暴露測量中的誤差可能會對所研究的暴露-疾病關係產生不同的影響,這取決於誤差的分佈方式。 如果流行病學研究是盲目進行的(即,在不了解研究參與者的疾病或健康狀況的情況下進行測量),我們預計測量誤差將均勻分佈在疾病或健康狀況的各個層面。

表 1 提供了一個示例:假設我們招募了一群在工作中接觸有毒物質的人,以調查一種常見疾病。 我們僅在招募時確定暴露狀態(T0), 而不是在後續的任何進一步時間點。 然而,假設許多人確實在下一年改變了他們的暴露狀態:在時間 T1,原來250名接觸者中有1,200人停止接觸,而原來150名未接觸者中有750人開始接觸毒物。 因此,在時間 T1, 1,100 人暴露,850 人未暴露。 因此,根據我們在時間 T 對暴露狀態的初始測量,我們對暴露進行了“錯誤分類”0. 然後在 20 年後(在時間 T2) 並評估疾病的累積風險。 (示例中的假設是只有超過一年的風險才是一個問題。)


表 1. 在時間 T 招募的 1950 人(在工作中暴露和未暴露)的假設隊列0 並且在時間 T 確定其疾病狀態2

Time

 

T0

T1

T2

暴露工人 1200 250 退出暴露 1100 (1200-250+150)

時間 T 的病例數2 = 220 暴露在外的工人

非接觸工人 750 150 開始接觸 850 (750-150+250)

時間 T 的病例數2 = 85 在未接觸的工人中

真正的風險 時間 T 的疾病2 在暴露的工人中為 20% (220/1100),
未接觸的工人 (10/85) 為 850%(風險比 = 2.0)。

預估風險 在 T2 被歸類為暴露於 T 的人群中的疾病0:20%
(即暴露者的真實風險)´ 950(即 1200-250)+ 10%
(即未暴露的真實風險)´ 250 = (190+25)/1200 = 17.9%

預估風險 在 T2 被歸類為非暴露的人群中的疾病
T0: 20%(即暴露者的真實風險)´ 150 +10%
(即未暴露的真實風險)´ 600(即 750-150)= (30+60)/750 = 12%

估計風險比率 = 17.9% / 12% = 1.49


在這個例子中,錯誤分類取決於研究設計和人群特徵,而不是暴露測量的技術限制。 錯誤分類的影響是暴露人群和未暴露人群的累積風險之間的“真實”比率 2.0 變為“觀察到”比率 1.49(表 1)。 這種對風險比率的低估源於暴露與疾病之間關係的“模糊”,這種情況發生在暴露的錯誤分類(如本例)根據疾病或健康狀況均勻分佈時(即,暴露測量是不受此人是否患有我們正在研究的疾病的影響)。

相比之下,當暴露錯誤分類未均勻分佈在感興趣的結果中時,可能會低估或高估感興趣的關聯。 在示例中,我們可能有 偏見, 如果暴露分類取決於工人的疾病或健康狀況,不僅會模糊病因學關係。 例如,如果我們決定從一組暴露的工人和一組未暴露的工人那裡收集生物樣本,以便識別與工作暴露相關的早期變化,就可能會出現這種情況。 與未暴露的工人樣本相比,暴露工人的樣本可能會以更準確的方式進行分析; 科學好奇心可能會促使研究人員測量暴露人群中的其他生物標誌物(包括淋巴細胞中的 DNA 加合物或 DNA 氧化損傷的尿液標誌物),假設這些人在科學上“更有趣”。 這是一種相當普遍的態度,但可能會導致嚴重的偏見。

 

返回

星期三,三月02 2011 03:15

統計方法

關於統計數據在因果關係的流行病學研究中的作用存在很多爭論。 在流行病學中,統計學主要是用於評估基於人類(以及動物)種群的數據的方法的集合。 特別是,統計學是一種對不確定現象進行量化和測量的技術。 所有處理現實的非確定性、可變方面的科學研究都可以從統計方法中受益。 在流行病學中,可變性是觀察單位所固有的——一個人不是一個確定性的實體。 雖然實驗設計會在更好地滿足隨機變化方面的統計假設方面得到改進,但出於倫理和實際原因,這種方法並不常見。 相反,流行病學從事的是觀察性研究,這些研究與隨機性和其他變異性來源相關聯。

統計理論關注如何控制數據中的非結構化可變性,以便從經驗觀察中做出有效的推論。 由於缺乏對所研究現象的可變行為的任何解釋,統計假設它是 隨機——也就是說,與某些平均自然狀態的非系統性偏差(參見 Greenland 1990 對這些假設的批評)。

科學依賴於經驗 證據 以證明其自然事件的理論模型是否有效。 事實上,統計理論中使用的方法決定了現實世界中的觀察與科學家以數學模型形式對現象的看法的符合程度。 因此,必須謹慎選擇基於數學的統計方法; 有很多關於“如何用統計數字說謊”的例子。 因此,流行病學家應該意識到他們用於衡量疾病風險的技術的適當性。 特別是,在解釋具有統計顯著性和非統計顯著性的結果時需要格外小心。

這個詞的第一個意思 統計 與根據一組值計算的任何匯總數量相關。 算術平均數、中位數或眾數等描述性指標或統計量被廣泛用於總結一系列觀察中的信息。 歷史上,這些摘要描述符被各州用於行政目的,因此被命名為 統計. 在流行病學中,常見的統計數據源自流行病學本質的比較,它提出的問題包括:“一個人群是否比另一個人群更容易患病?” 在進行此類比較時,相對風險是衡量個體特徵與患病概率之間關聯強度的常用指標,最常用於病原學研究; 歸因風險也是衡量個體特徵與疾病發生之間關聯的指標,但它強調的是通過消除相關因素的干預措施所避免的病例數的增加——它主要應用於公共衛生和預防醫學。

這個詞的第二個意思 統計 涉及技術的收集和統計推斷的基礎理論。 這是歸納邏輯的一種特殊形式,它指定了從一組特定的經驗觀察中獲得有效概括的規則。 如果滿足某些假設,這種概括將是有效的。 這是未經教育地使用統計數據欺騙我們的第二種方式:在觀察流行病學中,很難確定統計技術所隱含的假設。 因此,敏感性分析和穩健估計應該是任何正確進行的數據分析的伴侶。 最終結論也應基於整體知識,而不應完全依賴統計假設檢驗的結果。

定義

A 統計單位 是進行經驗觀察的元素。 它可以是一個人、一個生物標本或一塊待分析的原材料。 通常統計單位由研究人員獨立選擇,但有時可以設置更複雜的設計。 例如,在縱向研究中,隨著時間的推移對一組人進行一系列確定; 本研究中的統計單位是一組決定,它們不是獨立的,而是根據它們與被研究的每個人的各自聯繫構成的。 統計單位之間缺乏獨立性或相關性,在統計分析中值得特別注意。

A 變量 是在給定統計單位上測量的個體特徵。 它應該與 不變,固定的個體特徵——例如,在對人類的研究中,頭部或胸部是常數,而研究中單個成員的性別是變量。

使用不同的方法評估變量 測量尺度. 第一個區別是定性和定量尺度。 定性變量提供不同的 形式 or 類別. 如果每種模態不能相對於其他模態進行排序或排序——例如,頭髮顏色或性別模態——我們將變量表示為 公稱. 如果類別可以排序——比如疾病的嚴重程度——變量稱為 序數. 當一個變量由一個數值組成時,我們說這個尺度是定量的。 一種 離散的 scale 表示變量只能取一些確定的值——例如,疾病病例數的整數值。 一種 連續 尺度用於那些導致 數字。 據說連續尺度是 間隔 當 null 值具有純粹的約定意義時縮放。 也就是說,零值並不意味著零數量——例如,零攝氏度的溫度並不意味著零熱能。 在這種情況下,只有值之間的差異才有意義(這就是術語“間隔”尺度的原因)。 一個真正的空值表示 規模。 對於在該尺度上測量的變量,值的比率也是有意義的:事實上,兩倍的比率意味著兩倍的數量。 例如,說一個物體的溫度是第二個物體的兩倍意味著它的熱能是第二個物體的兩倍, 前提是 溫度是按比例測量的(例如,以開爾文度為單位)。 給定變量的一組允許值稱為變量的域。

統計範式

統計學處理從一組特定觀察結果中概括的方法。 這組經驗測量稱為 樣品. 我們從樣本中計算出一些描述性統計數據,以總結收集到的信息。

為了表徵一組測量通常需要的基本信息與其集中趨勢和可變性有關。 在幾個備選方案之間的選擇取決於用於測量現象的尺度以及計算統計數據的目的。 在表 1 中,描述了集中趨勢和變異性(或離散度)的不同度量,並與適當的度量尺度相關聯。

表 1. 按測量尺度劃分的集中趨勢和分散指數

 

測量尺度

 

定性

 

指數

定義

公稱

序數

區間/比率

算術平均值

觀察值總和除以觀察總數

 

x

中位數

觀察到的分佈的中點值

 

x

x

模式

最常見的值

x

x

x

範圍

分佈的最低和最高值

 

x

x

方差

每個值與平均值的平方差之和除以觀察總數減 1

 

 

x

 

計算的描述性統計量稱為 估計 當我們用它們來代替從中選擇樣本的人口的類似數量時。 估計的人口對應物是常量,稱為 參數. 可以使用不同的統計方法獲得相同參數的估計值。 估計應該既有效又精確。

總體樣本範式意味著可以通過從總體中選擇樣本的方式來確保有效性。 隨機或概率抽樣是通常的策略:如果總體中的每個成員被包含在樣本中的概率相同,那麼平均而言,我們的樣本應該代表總體,而且,任何與我們期望的偏差都可能是偶然解釋的。 如果已經執行了隨機抽樣,也可以計算出與我們預期的給定偏差的概率。 同樣的推理適用於為我們的樣本計算的關於總體參數的估計值。 例如,我們將樣本的算術平均值作為總體平均值的估計值。 樣本平均值和總體平均值之間的任何差異(如果存在)都歸因於樣本中成員的選擇過程中的隨機波動。 如果樣本是隨機選擇的,我們可以計算出這種差異的任何值的概率。 如果樣本估計值與總體參數之間的偏差不能由偶然原因解釋,則稱該估計值是 . 觀察或實驗的設計為估計提供了有效性,基本的統計範式是隨機抽樣。

在醫學中,當不同群體之間的比較是研究的目的時,採用第二種範式。 一個典型的例子是對照臨床試驗:根據預先定義的標準選擇一組具有相似特徵的患者。 在這個階段不關心代表性。 每位參加試驗的患者都通過隨機程序分配到治療組(接受標準療法和待評估的新藥)或對照組(接受標準療法和安慰劑)。 在此設計中,將患者隨機分配到每個組取代了樣本成員的隨機選擇。 兩組之間差異的估計可以統計評估,因為在新藥無效的假設下,我們可以計算任何非零差異的概率。

在流行病學中,我們缺乏隨機組合暴露人群和非暴露人群的可能性。 在這種情況下,我們仍然可以使用統計方法,就好像分析的組是隨機選擇或分配的一樣。 這一假設的正確性主要取決於研究設計。 這一點特別重要,它強調了流行病學研究設計相對於生物醫學研究中統計技術的重要性。

信號與噪聲

術語 隨機變量 指的是一個變量,其定義的概率與它可以假設的每個值相關聯。 隨機變量概率分佈的理論模型是總體模型。 樣本對應物由樣本頻率分佈表示。 這是報告一組數據的有用方法; 它由一個笛卡爾平面組成,橫軸是感興趣的變量,縱軸是頻率或相對頻率。 圖形顯示使我們能夠很容易地看到什麼是最頻繁的值,以及分佈如何集中在某些中心值(如算術平均值)周圍。

對於隨機變量及其概率分佈,我們使用術語 參數, 平均期望值 (而不是算術平均值)和 方差. 這些理論模型描述了給定現象的可變性。 在信息論中,信號用集中趨勢(例如均值)來表示,而噪聲則用分散指數(例如方差)來衡量。

為了說明統計推斷,我們將使用二項式模型。 在接下來的部分中,將介紹點估計和置信區間的概念、假設檢驗和錯誤決策的概率以及研究的功效。

表 2. 二項式實驗的可能結果(是 = 1,否 = 0)及其概率(n = 3)

工作者

機率

A

B

C

 

0

0

0

1

0

0

0

1

0

0

0

1

0

1

1

1

0

1

1

1

0

1

1

1

 

一個例子:二項分佈

在生物醫學研究和流行病學中,最重要的隨機變異模型是二項分佈。 它依賴於這樣一個事實,即大多數現象表現為只有兩個類別的名義變量:例如,疾病的存在/不存在:活著/死亡,或康復/生病。 在這種情況下,我們感興趣的是成功的可能性——即感興趣的事件(例如,存在疾病、活著或康復)——以及可以改變它的因素或變量。 讓我們考慮一下 n = 3 名工人,假設我們對有視力障礙(是/否)的概率 p 感興趣。 我們觀察的結果可能是表 2 中的可能結果。

表 3. 二項式實驗的可能結果(是 = 1,否 = 0)及其概率(n = 3)

成功次數

機率

0

1

2

3

 

任何這些事件組合的概率很容易通過考慮 p 來獲得,p 是(個體)成功概率,對每個受試者都是常數並且獨立於其他結果。 由於我們感興趣的是成功的總數而不是特定的有序序列,我們可以按如下方式重新排列表格(見表 3),並且通常表示 x 成功 P(x) 如:

哪裡 x 是成功的次數和符號 x! 表示的階乘 x,即 x! = x×(x–1)×(x–2)…×1。

當我們考慮事件“生病/未生病”時,個體概率, 指假定主體的狀態; 在流行病學中,這種概率被稱為“患病率”。 為了估計 p,我們使用樣本比例:

p = x/n

有差異:

在一個假設的無限系列的相同大小的複製樣本中 n,我們會得到不同的樣本比例 p = x/n, 概率由二項式公式給出。 的“真實”價值  由每個樣本比例估計,並且 p 的置信區間,即 p 的一組可能值,給定觀察數據和預定義的置信水平(比如 95%),從二項分佈估計為p 的一組值,它給出的概率是 x 大於預先指定的值(比如 2.5%)。 對於我們觀察到的假設實驗 x = 15 次成功 n = 30 次試驗,估計成功的概率為:

p = x/n = 15/30 = 0.5 

表 4. 二項分佈。 不同值的概率  在 n = 15 次試驗中 x = 30 次成功

機率

0.200

0.0002

0.300

0.0116

0.334

0.025

0.400

0.078

0.500

0.144

0.600

0.078

0.666

0.025

0.700

0.0116

 

從表 95 中獲得的 p 的 4% 置信區間為 0.334 – 0.666。 表中的每個條目顯示的概率 x = 15 次成功 n = 30 次試驗,用二項式公式計算; 例如,對於 = 0.30,我們從:

n 大和 p 接近 0.5 我們可以使用基於高斯分佈的近似值:

哪裡 za /2 表示概率的標準高斯分佈的值

P (|z| ³ za /2) = a/2;

1 – a 是選定的置信水平。 對於所考慮的例子, = 15/30 = 0.5; n = 30 並且來自標準高斯表 z0.025 = 1.96。 95% 的置信區間導致值集 0.321 – 0.679,通過代入獲得 p = 0.5, n = 30,和 z0.025 = 1.96 代入上述高斯分佈方程。 請注意,這些值接近於之前計算的精確值。

假設的統計檢驗包括關於人口參數值的決策程序。 假設,在前面的例子中,我們想要解決一個命題,即給定工廠的工人視力受損的風險較高。 我們的經驗觀察要檢驗的科學假設是“特定工廠的工人視力受損的風險增加”。 統計學家通過偽造補充假設“視力障礙風險沒有升高”來證明這些假設。 這遵循數學證明 荒謬的 並且,經驗證據不用於驗證斷言,而僅用於證偽斷言。 統計假設稱為 零假設. 第二步涉及為用於對觀察中的可變性建模的概率分佈的參數指定一個值。 在我們的示例中,由於現像是二元的(即存在/不存在視覺障礙),我們選擇參數為 p 的二項分佈,即視覺障礙的概率。 零假設斷言 = 0.25,比方說。 該值是從有關該主題的知識集合和非暴露(即非工人)人群中視力障礙通常流行的先驗知識中選擇的。 假設我們的數據產生了一個估計 = 0.50,來自被檢查的 30 名工人。

我們可以拒絕原假設嗎?

如果是,贊成什麼 替代 假設?

如果證據表明原假設被拒絕,我們將指定一個替代假設作為候選假設。 非定向(雙側)備擇假設聲明總體參數與零假設中聲明的值不同; 方向性(單向)備擇假設聲明總體參數大於(或小於)空值。

表 5. 二項分佈。 成功概率  = 0.25 英寸 n = 30 次試驗

X

機率

累積概率

0

0.0002

0.0002

1

0.0018

0.0020

2

0.0086

0.0106

3

0.0269

0.0374

4

0.0604

0.0979

5

0.1047

0.2026

6

0.1455

0.3481

7

0.1662

0.5143

8

0.1593

0.6736

9

0.1298

0.8034

10

0.0909

0.8943

11

0.0551

0.9493

12

0.0291

0.9784

13

0.0134

0.9918

14

0.0054

0.9973

15

0.0019

0.9992

16

0.0006

0.9998

17

0.0002

1.0000

.

.

.

30

0.0000

1.0000

 

在原假設下,我們可以計算出示例結果的概率分佈。 表 5 顯示,對於 = 0.25和 n = 30,概率(見等式(1))和累積概率:

從這張表中,我們得到了擁有的概率 x ³15 名有視力障礙的工人

P(x ³15) = 1 -P(X15) = 1 - 0.9992 = 0.0008

這意味著,如果他們經歷了非暴露人群的疾病流行,我們極不可能觀察到 15 名或更多有視力障礙的工人。 因此,我們可以拒絕原假設並確認所研究的工人人群中視力障礙的患病率更高。

时间 n×p³ 5 和 n×(1-) ³ 5,我們可以使用高斯近似:

從標準高斯分佈表中我們得到:

P(|z|>2.95) = 0.0008

與確切的結果非常吻合。 從這個近似我們可以看出,假設的統計檢驗的基本結構由信噪比組成。 在我們的例子中,信號是(p - ), 觀察到的與零假設的偏差,而噪聲是標準偏差 P:

比值越大,空值概率越小.

在做出有關統計假設的決策時,我們可能會犯兩種錯誤:I 類錯誤,當原假設為真時拒絕原假設; 或 II 型錯誤,當原假設為假時接受原假設。 概率水平,或 p值, 是 I 類錯誤的概率,用希臘字母 a 表示。 這是根據原假設下觀測值的概率分佈計算得出的。 通常預先定義一個錯誤水平(例如,5%、1%),並在我們的觀察結果的概率等於或小於這個所謂的臨界水平時拒絕零假設。

II 類錯誤的概率用希臘字母 β 表示。 要計算它,我們需要在備擇假設中指定要測試的參數的 α 值(在我們的示例中,α 值用於 ). 通用備選假設(不同於、大於、小於)沒有用。 在實踐中,一組備擇假設的 β 值或其補充值是有意義的,這稱為檢驗的統計功效。 例如,將 α-error 值固定為 5%,從表 5 中我們發現:

P(x ³12) <0.05

在原假設下 = 0.25。 如果我們至少要觀察 x = 12 次成功,我們將拒絕原假設。 相應的 β 值和冪為 x = 12 由表 6 給出。 

表 6. x = 12、n = 30、α = 0.05 的 II 類誤差和功效

β

電力

0.30

0.9155

0.0845

0.35

0.7802

0.2198

0.40

0.5785

0.4215

0.45

0.3592

0.6408

0.50

0.1808

0.8192

0.55

0.0714

0.9286

 

在這種情況下,我們的數據無法區分是否 大於零值 0.25 但小於 0.50,因為對於這些值,研究的功效太低 (<80%) <0.50——也就是說,我們研究的靈敏度是 8% = 0.3, 22% 對於 = 0.35,..., 64% 對於 = 0.45。

實現較低 β 值或較高功效水平的唯一方法是增加研究規模。 例如,在表 7 中,我們報告了 β 和功效 n = 40; 正如預期的那樣,我們應該能夠檢測到  值大於 0.40。 

表 7. x = 12、n = 40、α = 0.05 的 II 類誤差和功效

β

電力

0.30

0.5772

0.4228

0.35

0.3143

0.6857

0.40

0.1285

0.8715

0.45

0.0386

0.8614

0.50

0.0083

0.9917

0.55

0.0012

0.9988

 

研究設計基於對一組備選假設的仔細審查,這些備選假設值得考慮並保證提供足夠樣本量的研究的功效。

在流行病學文獻中,強調了提供可靠風險估計的相關性。 因此,報告置信區間(95% 或 90%)比報告更重要 p-假設檢驗的值。 按照同樣的推理,應該注意對小規模研究結果的解釋:由於低功效,即使是中間效應也可能無法檢測到,另一方面,隨後可能無法複製巨大的效應。

高級方法

在過去幾年中,職業醫學背景下使用的統計方法的複雜程度一直在增加。 在統計建模領域可以找到重大發展。 Nelder 和 Wedderburn 系列的非高斯模型(廣義線性模型)一直是對職業流行病學等領域知識增長最顯著的貢獻之一,相關響應變量是二元的(例如,生存/死亡)或計數(例如,工業事故的數量)。

這是廣泛應用回歸模型作為基於列聯表(簡單和分層分析)的更傳統分析類型的替代方案的起點。 泊松、考克斯和邏輯回歸現在通常分別用於縱向和病例對照研究的分析。 這些模型是分類響應變量線性回歸的對應物,具有直接提供相關流行病學關聯度量的優雅特徵。 例如,泊松回歸的係數是比率的對數,而邏輯回歸的係數是優勢比的對數。

以此為基準,統計建模領域的進一步發展主要有兩個方向:重複分類測量的模型和擴展廣義線性模型(廣義加性模型)的模型。 在這兩種情況下,目標都集中在提高統計工具的靈活性,以應對現實中出現的更複雜的問題。 許多職業研究都需要重複測量模型,其中分析單位處於亞個體水平。 例如:

  1. 研究工作條件對腕管綜合症的影響必須考慮一個人的雙手,它們不是彼此獨立的。
  2. 環境污染物的時間趨勢分析及其對兒童呼吸系統的影響可以使用極其靈活的模型進行評估,因為劑量-反應關係的確切函數形式很難獲得。

 

在貝葉斯統計的背景下,已經看到了平行的並且可能更快的發展。 在引入計算機密集型方法後,使用貝葉斯方法的實際障礙消失了。 Monte Carlo 程序,例如 Gibbs 抽樣方案,使我們無需進行數值積分來計算代表貝葉斯方法最具挑戰性的特徵的後驗分佈。 貝葉斯模型在實際和復雜問題中的應用數量在應用期刊中發現了越來越多的空間。 例如,小區域級別的地理分析和生態相關性以及艾滋病預測模型越來越多地使用貝葉斯方法來處理。 這些發展受到歡迎,因為它們不僅代表了可用於流行病學數據分析的替代統計解決方案數量的增加,而且還因為貝葉斯方法可以被認為是一種更合理的策略。

 

返回

本章前面的文章表明需要仔細評估研究設計,以便從流行病學觀察中得出可靠的推論。 儘管有人聲稱由於該學科的非實驗性質,觀察流行病學的推論很薄弱,但隨機對照試驗或其他類型的實驗設計並不比精心計劃的觀察具有內在的優勢(Cornfield 1954)。 然而,要得出可靠的推論,就需要對研究設計進行徹底的分析,以確定潛在的偏倚和混雜因素。 假陽性和假陰性結果都可能源於不同類型的偏見。

在這篇文章中,討論了一些被提議用於評估流行病學觀察的因果性質的指南。 此外,雖然良好的科學是倫理上正確的流行病學研究的前提,但還有其他與倫理問題相關的問題。 因此,我們專門討論了分析流行病學研究中可能出現的倫理問題。

因果關係評估

幾位作者討論了流行病學中的因果關係評估(Hill 1965;Buck 1975;Ahlbom 1984;Maclure 1985;Miettinen 1985;Rothman 1986;Weed 1986;Schlesselman 1987;Maclure 1988;Weed 1988;Karhausen 1995)。 討論的要點之一是流行病學是否使用或應該使用與其他科學中使用的相同標準來確定因果關係。

原因不應與機制相混淆。 例如,石棉是間皮瘤的病因,而致癌基因突變是一種推定的機制。 根據現有證據,很可能 (a) 不同的外部暴露可以在相同的機制階段起作用,並且 (b) 通常在疾病發展過程中沒有固定和必要的機制步驟順序。 例如,致癌作用被解釋為一系列隨機(概率)轉變,從基因突變到細胞增殖再到基因突變,最終導致癌症。 此外,致癌是一個多因素過程——也就是說,不同的外部暴露都會對其產生影響,而對於易感人群來說,這些都不是必需的。 該模型可能適用於癌症以外的多種疾病。

大多數暴露-疾病關係的這種多因素和概率性質意味著,解開一種特定暴露所扮演的角色是有問題的。 此外,流行病學的觀察性質使我們無法進行可以通過故意改變事件過程來闡明病因學關係的實驗。 觀察到暴露與疾病之間的統計關聯並不意味著該關聯是因果關係。 例如,大多數流行病學家將暴露於柴油機尾氣和膀胱癌之間的關聯解釋為因果關係,但其他人則聲稱,與未暴露於柴油機尾氣的人相比,暴露於柴油機尾氣的工人(主要是卡車和出租車司機)更經常吸煙. 根據這一說法,觀察到的關聯因此會被吸煙等眾所周知的風險因素“混淆”。

鑑於大多數暴露與疾病關聯的概率多因素性質,流行病學家製定了指南來識別可能存在因果關係的關係。 這些是 Bradford Hill 爵士最初針對慢性病提出的指南(1965 年):

  • 協會實力
  • 量效效應
  • 沒有時間歧義
  • 結果的一致性
  • 生物學合理性
  • 證據的連貫性
  • 協會的特殊性。

 

這些標準應僅被視為一般準則或實用工具; 事實上,科學的因果評估是一個以測量暴露與疾病關係為中心的迭代過程。 然而,Hill 的標準經常被用作流行病學中因果推理過程的簡明和實用的描述。

讓我們考慮應用 Hill 標準的氯乙烯暴露與肝血管肉瘤之間關係的示例。

流行病學研究結果的通常表達方式是衡量暴露與疾病之間的關聯程度(希爾第一標準)。 大於單位的相對風險 (RR) 意味著暴露與疾病之間存在統計關聯。 例如,如果肝血管肉瘤的發病率通常為千萬分之一,但在接觸氯乙烯的人群中為十萬分之一,則 RR 為 1(即接觸氯乙烯的人的發病率增加了 10 倍)與不接觸氯乙烯的人相比,患血管肉瘤的風險)。

當風險隨著暴露水平的增加而增加(劑量反應效應,Hill 的第二個標準),以及當暴露和疾病之間的時間關係在生物學上有意義(暴露先於效應和這個“誘導”期的長度與疾病的生物學模型相容;Hill 的第三個標準)。 此外,當能夠在不同情況下複製發現的其他人獲得相似的結果時,關聯更有可能是因果關係(“一致性”,希爾的第四個標準)。

對結果進行科學分析需要評估生物學合理性(希爾的第五條標準)。 這可以通過不同的方式實現。 例如,一個簡單的標準是評估所謂的“原因”是否能夠到達目標器官(例如,沒有到達肺部的吸入物質不能在體內循環)。 此外,來自動物研究的支持性證據也很有幫助:在用氯乙烯治療的動物身上觀察到的肝血管肉瘤強烈強化了在人類身上觀察到的關聯。

觀察結果的內部連貫性(例如,兩性的 RR 同樣增加)是一個重要的科學標準(希爾的第六條標準)。 當關係非常具體時,因果關係更有可能——即涉及罕見原因和/或罕見疾病,或特定組織學類型/患者亞組(希爾的第七條標準)。

“枚舉歸納法”(暴露與疾病之間關聯實例的簡單枚舉)不足以完全描述因果推理中的歸納步驟。 通常,枚舉歸納的結果會產生復雜且仍然混亂的觀察結果,因為不同的因果鏈,或者更常見的是,真正的因果關係和其他不相關的暴露被糾纏在一起。 必須通過“排除歸納法”排除替代解釋,表明關聯很可能是因果關係,因為它不會與其他解釋“混淆”。 另一種解釋的簡單定義是“一個外來因素,其影響與利息風險的影響混合在一起,從而扭曲了對利息風險的風險估計”(Rothman 1986)。

歸納的作用是擴展知識,而演繹的作用是“傳遞真理”(Giere 1979)。 演繹推理會仔細檢查研究設計並確定在經驗上不正確但在邏輯上正確的關聯。 這種聯想不是事實,而是邏輯上的必然。 例如,一個 選擇偏見 當在病人中選擇暴露組時(例如當我們開始一項隊列研究招募“暴露於”一組肝血管肉瘤病例的氯乙烯時)或在健康人中選擇未暴露組時,就會發生這種情況。 在這兩種情況下,在暴露和疾病之間發現的關聯是必然的(邏輯上)但經驗上不是真實的(Vineis 1991)。

總而言之,即使考慮其觀察(非實驗)性質,流行病學也不使用與其他科學學科的傳統有很大不同的推理程序(Hume 1978;Schaffner 1993)。

流行病學研究中的倫理問題

由於推斷因果關係的微妙之處,流行病學家在解釋他們的研究時必須特別小心。 確實,由此產生了一些道德問題。

流行病學研究中的倫理問題已成為激烈討論的主題(Schulte 1989;Soskolne 1993;Beauchamp 等人 1991)。 原因很明顯:流行病學家,尤其是職業和環境流行病學家,經常研究具有重大經濟、社會和衛生政策影響的問題。 關於特定化學品暴露與疾病之間關聯的負面和正面結果都會影響成千上萬人的生活,影響經濟決策,從而嚴重影響政治選擇。 因此,流行病學家可能會受到壓力,並受到其他人的誘惑甚至鼓勵,以輕微或實質性地改變對其調查結果的解釋。

在幾個相關問題中, 透明度 數據收集、編碼、計算機化和分析的過程是對研究人員的偏見指控進行辯護的核心。 同樣重要且可能與這種透明度相衝突的是,參與流行病學研究的受試者有權受到保護,不被洩露個人信息
(保密 問題)。

從特別是在因果推理的背景下可能出現的不當行為的角度來看,道德準則應解決的問題是:

  • 誰擁有數據,數據必須保留多長時間?
  • 什麼構成已完成工作的可靠記錄?
  • 公共撥款是否允許預算用於與數據的充分文檔化、歸檔和重新分析相關的成本?
  • 主要研究者是否可以參與任何第三方對其數據的重新分析?
  • 是否有數據存儲的實踐標準?
  • 職業和環境流行病學家是否應該建立一種規範的氛圍,以便可以完成現成的數據審查或審計?
  • 良好的數據存儲實踐如何不僅可以防止不當行為,還可以防止對不當行為的指控?
  • 什麼構成與數據管理、結果解釋和宣傳相關的職業和環境流行病學不端行為?
  • 流行病學家和/或專業機構在為其評估制定實踐標準和指標/結果以及在任何宣傳角色中貢獻專業知識方面的作用是什麼?
  • 專業機構/組織在處理道德和法律問題方面扮演什麼角色? (索斯科爾內 1993)

 

就職業和環境流行病學而言,其他關鍵問題涉及工人參與研究的初步階段,以及將研究結果發布給已登記並受到直接影響的受試者(Schulte 1989 ). 不幸的是,參加流行病學研究的工作人員參與關於研究目的、其解釋和研究結果的潛在用途(可能對工作人員有利和不利)的協作討論並不常見。

最近的指南(Beauchamp 等人 1991 年;CIOMS 1991 年)對這些問題提供了部分答案。 然而,在每個國家,職業流行病學家的專業協會應該就倫理問題進行徹底的討論,並可能採用一套適合當地情況的倫理指南,同時承認國際公認的規範實踐標準。

 

返回

在台灣這樣的國家,職業病的記錄對職業醫生來說是一個挑戰。 由於缺乏包含材料安全數據表 (MSDS) 的系統,工人通常不知道他們工作時使用的化學品。 由於許多職業病潛伏期長,在臨床表現出來之前不會表現出任何特定的症狀和體徵,因此識別和識別職業病原體往往非常困難。

為了更好地控制職業病,我們訪問了數據庫,其中提供了相對完整的工業化學品清單以及一組特定的體徵和/或症狀。 結合猜想和反駁(即考慮並排除所有可能的替代解釋)的流行病學方法,我們記錄了十多種職業病和肉毒桿菌中毒的爆發。 我們建議將類似的方法應用於處於類似情況的任何其他國家,並提倡和實施一種涉及每種化學品的識別表(例如 MSDS)的系統,作為一種能夠迅速識別並因此預防職業性疾病。

彩印廠的肝炎

1985年,彩印廠三名工人因急性肝炎住進社區醫院。 三者中的一者疊加了急性腎功能衰竭。 由於病毒性肝炎在台灣的流行率很高,我們應該在最可能的病因中考慮病毒起源。 酒精和藥物的使用以及工作場所的有機溶劑也應包括在內。 由於台灣沒有 MSDS 系統,員工和雇主都不知道工廠使用的所有化學品(Wang 1991)。

我們必須從幾個毒理學數據庫中編制一份肝毒性和腎毒性藥物清單。 然後,我們從上述假設中推導出所有可能的推論。 例如,如果甲型肝炎病毒(HAV)是病原體,我們應該在受影響的工人中觀察抗體(HAV-IgM); 如果乙型肝炎病毒是病因,與未受影響的工人相比,我們應該在受影響的工人中觀察到更多的乙型肝炎表面抗原 (HBsAg) 攜帶者; 如果酒精是主要病因,我們應該在受影響的工人中觀察到更多的酗酒者或長期酗酒者; 如果任何有毒溶劑(例如氯仿)是病因,我們應該在工作場所找到它。

我們對每位工人進行了全面的醫療評估。 病毒病原學和酒精假說很容易被駁倒,因為它們沒有證據支持。

相反,該工廠的 17 名工人中有 25 人的肝功能測試異常,並且發現肝功能異常的存在與最近在三個房間中的任何一個房間內工作的歷史之間存在顯著關聯,其中互連的空調系統已被關閉安裝以冷卻印刷機。 在按乙型肝炎攜帶者狀況進行分層後,該關聯仍然存在。後來確定,該事件是在無意中使用“清潔劑”(即四氯化碳)清潔印刷機中的泵後發生的。 此外,泵清洗操作的模擬測試顯示環境空氣中的四氯化碳濃度為 115 至 495 ppm,這可能會導致肝損傷。 在進一步的反駁嘗試中,通過消除工作場所的四氯化碳,我們發現不再有新病例發生,所有受影響的工人在離開工作場所20天后都有所改善。 因此,我們得出結論,此次疫情是由四氯化碳的使用引起的。

彩印廠的神經症狀

1986年1991月,彰化彩印廠學徒突然雙側急性無力、呼吸麻痺。 受害人的父親在電話中稱,還有其他幾名工人也有類似症狀。 由於曾有彩色印刷廠因接觸有機溶劑而導致職業病的記錄,因此我們前往工地確定病因,並假設可能是溶劑中毒(Wang XNUMX)。

然而,我們通常的做法是考慮所有替代猜想,包括其他醫學問題,包括上運動神經元、下運動神經元以及神經肌肉接頭的功能受損。 同樣,我們從上述假設中推導出結果陳述。 例如,如果據報導任何溶劑(如正己烷、甲基丁酮、丙烯酰胺)是引起多發性神經病的原因,它也會損害神經傳導速度 (NCV); 如果是涉及上運動神經元的其他醫學問題,則會出現意識障礙和/或不自主運動的跡象。

現場觀察顯示,所有受影響的工人在整個臨床過程中都有清晰的意識。 對三名受影響的工人進行的 NCV 研究顯示下運動神經元完好無損。 沒有不自主運動,在出現症狀之前沒有服藥史或咬傷史,新斯的明試驗呈陰性。 發現26月27日或32日在工廠食堂吃早餐與生病有顯著關聯; 這兩天,XNUMX 名受影響工人中有 XNUMX 人與 XNUMX 名未受影響工人中有 XNUMX 人在工廠吃早餐。 進一步化驗結果顯示,一家無牌公司生產的花生罐頭內檢出A型肉毒桿菌毒素,其標本亦顯示長滿A型肉毒桿菌毒素。 肉毒桿菌. 最終的駁回審判是將此類產品從商業市場上撤下,這導致沒有新案件。 該調查記錄了台灣商業食品中的第一例肉毒桿菌中毒病例。

百草枯製造商的癌前皮膚損傷

1983 年 1985 月,一家百草枯製造廠的兩名工人到一家皮膚科診所就診,抱怨他們暴露在陽光下的手、頸部和麵部出現多處雙側色素沉著過度斑點和過度角化變化。 一些皮膚標本也顯示出 Bowenoid 變化。 由於在聯吡啶製造工人中報告了惡性和癌前皮膚損傷,因此強烈懷疑是職業原因。 然而,我們還必須考慮皮膚癌的其他替代原因(或假設),例如暴露於電離輻射、煤焦油、瀝青、煤煙或任何其他多環芳烴 (PAH)。 為了排除所有這些猜想,我們在 28 年進行了一項研究,訪問了所有 1987 家曾經從事百草枯製造或包裝的工廠,並檢查了製造過程和工人(Wang et al. 1993;Wang XNUMX)。

我們檢查了 228 名工人,除陽光和 4'-4'-聯吡啶及其異構體外,他們都沒有接觸過上述皮膚致癌物。 在排除多次接觸的工人後,我們發現七分之一的管理人員和八十二名百草枯包裝工人中的兩名出現色素沉著過度的皮膚病變,而三分之三的工人只涉及聯吡啶結晶和離心。 此外,所有 82 名患有角化過度或 Bowen 病灶的工人都有直接接觸聯吡啶及其異構體的歷史。 接觸聯吡啶的時間越長,皮膚損傷的可能性越大,分層和邏輯回歸分析表明,這種趨勢不能用陽光或年齡來解釋。 因此,皮膚損傷暫時歸因於聯吡啶暴露和陽光的組合。 如果在包含所有涉及聯吡啶暴露的過程後發生任何新案例,我們將進一步反駁嘗試跟進。 沒有發現新病例。

討論和結論

以上三個例子說明了採用反駁的方式和建立職業病數據庫的重要性。 前者使我們總是以與最初的直覺假設相同的方式考慮備選假設,而後者提供了一份詳細的化學試劑清單,可以指導我們找到真正的病因。 這種方法的一個可能限制是我們只能考慮那些我們可以想像的替代解釋。 如果我們的備選方案列表不完整,我們可能得不到答案或得到錯誤答案。 因此,全面的職業病數據庫對於這一戰略的成功至關重要。

我們曾經費力地構建自己的數據庫。 然而,最近發布的 OSH-ROM 數據庫包含超過 160,000 條摘要的 NIOSHTIC 數據庫,可能是用於此目的的最全面的數據庫之一,正如本文其他部分所討論的那樣 百科全書. 此外,如果發生新的職業病,我們可能會搜索這樣的數據庫並排除所有已知的病原體,並且無一例外。 在這種情況下,我們可能會嘗試盡可能具體地識別或定義新代理人(或職業設置),以便首先緩解問題,然後檢驗進一步的假設。 百草枯製造商的癌前皮膚病變案例就是此類的一個很好的例子。

 

返回

" 免責聲明:國際勞工組織不對本門戶網站上以英語以外的任何其他語言呈現的內容負責,英語是原始內容的初始製作和同行評審所使用的語言。自此以來,某些統計數據尚未更新百科全書第 4 版的製作(1998 年)。”

內容