28.流行病學與統計學
章節編輯: Franco Merletti、Colin L. Soskolne 和 Paolo Vineis
流行病學方法應用於職業健康與安全
Franco Merletti、Colin L. Soskolne 和 Paolo Vineis
暴露評估
M·杰拉爾德·奧特
總結工作生活接觸措施
科林·L·索斯科尼
測量暴露的影響
謝莉亞·霍爾·扎姆
案例研究:措施
Franco Merletti、Colin L. Soskolne 和 Paola Vineis
研究設計中的選項
斯文赫恩伯格
研究設計中的有效性問題
安妮·薩斯科
隨機測量誤差的影響
Paolo Vineis 和 Colin L. Soskolne
統計方法
Annibale Biggeri 和馬里奧布拉加
流行病學研究中的因果關係評估和倫理
保羅維尼斯
流行病學調查問卷
Steven D. Stellman 和 Colin L. Soskolne
石棉歷史透視
勞倫斯加芬克爾
單擊下面的鏈接以在文章上下文中查看表格.
2. 疾病發生的措施
3. 隊列研究的關聯測量
4. 病例對照研究的關聯措施
5. 群組數據的一般頻率表佈局
6. 病例對照數據的樣本佈局
9. 集中趨勢和分散指數
10 二項式實驗和概率
11 二項式實驗的可能結果
14 II 類錯誤和功效; x = 12, n = 30,一個 = 0.05
15 II 類錯誤和功效; x = 12, n = 40,一個 = 0.05
指向縮略圖以查看圖片標題,單擊以在文章上下文中查看圖片.
流行病學
流行病學被認為是預防醫學的基礎科學,也是為公共衛生政策過程提供信息的科學。 已經提出了幾種流行病學的操作定義。 最簡單的是,流行病學是研究人類和動物種群中疾病或其他與健康相關的特徵的發生。 流行病學家不僅研究疾病的頻率,而且研究頻率是否因人群而異; 即,他們研究暴露與疾病之間的因果關係。 疾病不是隨機發生的; 它們有原因——通常是人為原因——是可以避免的。 因此,如果知道病因,許多疾病是可以預防的。 流行病學方法對於確定許多致病因素至關重要,這些致病因素反過來又導致制定旨在預防疾病、傷害和過早死亡的衛生政策。
流行病學的任務是什麼?當流行病學的定義和概念應用於職業健康時,它的優缺點是什麼? 本章解決了這些問題以及使用流行病學技術調查職業健康危害的方法。 本文介紹了本章後續文章中的思想。
職業流行病學
職業流行病學被定義為研究工作場所暴露對人群中疾病和傷害的頻率和分佈的影響。 因此,它是一門以暴露為導向的學科,與流行病學和職業健康都有聯繫(Checkoway 等人,1989 年)。 因此,它使用的方法類似於流行病學一般採用的方法。
職業流行病學的主要目標是通過確定工作場所暴露對健康的影響來進行預防。 這強調了職業流行病學的預防重點。 事實上,職業健康與安全領域的所有研究都應服務於預防目的。 因此,流行病學知識可以而且應該易於實施。 雖然公共衛生利益始終應該是流行病學研究的主要關注點,但既得利益可以施加影響,必須注意在研究的製定、實施和/或解釋中盡量減少這種影響(Soskolne 1985;Soskolne 1989)。
職業流行病學的第二個目標是使用特定環境的結果來減少或消除整個人群中的危害。 因此,除了提供有關工作場所暴露對健康影響的信息外,職業流行病學研究的結果還在估計與相同暴露相關但一般人群普遍經歷的較低水平的風險方面發揮作用。 工業過程和產品造成的環境污染通常會導致接觸水平低於工作場所的接觸水平。
職業流行病學的應用層次有:
職業暴露在疾病、傷害和過早死亡的發展中可能發揮的因果作用早已被確定,並且是流行病學歷史的一部分。 必須參考 Bernardino Ramazzini,他是職業醫學的創始人,也是最早復興和補充健康依賴於可識別的自然外部因素的希波克拉底傳統的人之一。 1700 年,他在他的“De Morbis Artificum Diatriba”(Ramazzini 1705;Saracci 1995)中寫道:
醫生不得不問病人很多問題。 希波克拉底在 情書: “當你面對一個病人時,你應該問他,他的病是什麼,為什麼,病了多少天,他吃了什麼,他的大便情況如何。 對於所有這些問題,應該添加一個:'他做什麼工作?'。
這種對臨床觀察和對疾病發生周圍環境的關注的重新喚醒,使 Ramazzini 識別和描述了許多後來被職業醫生和流行病學家研究的職業病。
使用這種方法,Pott 於 1775 年首先報告了癌症與職業之間可能存在的聯繫 (Pott 1775) (Clayson 1962)。 他對煙囪清潔工陰囊癌的觀察始於對該疾病的描述,並繼續說:
這些人的命運似乎異常艱難:在他們幼年時期,他們最常遭受殘酷對待,幾乎餓得又冷又餓; 他們被推上狹窄的、有時是熱的煙囪,在那裡他們被擦傷、燒傷,幾乎窒息; 當他們進入青春期時,特別容易患上最令人討厭、痛苦和致命的疾病。
對於這最後一種情況,毫無疑問,儘管可能沒有得到足夠的關注,以使其廣為人知。 其他人有相同部位的癌症; 除了鉛工、普瓦圖腸絞痛和隨之而來的癱瘓之外,其他人也是如此; 但這仍然是他們特別容易患上的一種疾病。 掃煙囪的人也會患上陰囊和睾丸癌。
在這些人身上,這種疾病似乎起源於陰囊褶皺中積聚的煙灰,起初並不是一種習慣病……但這裡的受試者很年輕,總體上身體健康,至少首先; 他們的職業給他們帶來的疾病,很可能是當地的; 最後一種情況,我認為,可以從它總是抓住相同的部分而被合理地推定出來; 所有這些使得它(起初)與出現在老年男性身上的癌症截然不同。
這個關於職業癌症的第一個記錄仍然是清醒的典範。 疾病的性質、有關的職業和可能的致病因素都已明確界定。 儘管沒有提供定量數據來證實這一說法,但注意到煙囪清潔工中陰囊癌的發病率有所增加。
又過了五十年,Ayrton-Paris 在 1822 年註意到 (Ayrton-Paris 1822) 康沃爾的銅和錫冶煉廠經常發生陰囊癌,並推測砷煙可能是致病因子。 馮·沃爾克曼 (Von Volkmann) 於 1874 年報告了薩克森石蠟工人的皮膚腫瘤,此後不久,貝爾 (Bell) 於 1876 年提出頁岩油是導致皮膚癌的原因 (Von Volkmann 1874;貝爾 1876)。 癌症的職業起源的報告隨後變得相對頻繁(Clayson 1962)。
在職業病的早期觀察中,Schneeberg 礦工的肺癌發病率有所增加(Harting 和 Hesse,1879 年)。 值得注意(也是悲慘的),最近的一項案例研究表明,施內貝格的肺癌流行仍然是一個巨大的公共衛生問題,距 1879 年首次觀察到肺癌已有一個多世紀了。一種確定疾病“增加”的方法甚至量化它已經存在於職業醫學的歷史中。 例如,正如 Axelson (1994) 所指出的,WA Guy 在 1843 年研究了凸版印刷機的“肺部消耗”,發現排字工的風險高於印刷工; 這是通過應用類似於病例對照方法的設計來完成的(Lilienfeld 和 Lilienfeld 1979)。 然而,也許直到 1950 世紀 1954 年代初,現代職業流行病學及其方法才開始發展。 標誌著這一發展的主要貢獻是對染料工人的膀胱癌(Case 和 Hosker 1952)和天然氣工人的肺癌(Doll XNUMX)的研究。
職業流行病學問題
本章中的文章介紹了流行病學調查的理念和工具。 他們專注於評估工人的暴露經歷以及這些人群中出現的疾病。 本章討論了就從接觸有害物質到疾病發展的途徑中可能存在的因果關係得出有效結論的問題。
確定個人的工作生活暴露經歷構成了職業流行病學的核心。 流行病學研究的信息量首先取決於可用暴露數據的質量和範圍。 其次,職業流行病學家關注的健康影響(或疾病)必須在定義明確且易於接近的工人群體中準確確定。 最後,流行病學家應獲得有關對感興趣疾病的其他潛在影響的數據,以便從研究中確定的任何職業暴露影響都可以歸因於職業暴露 本身 而不是有關疾病的其他已知原因。 例如,在一群可能使用疑似導致肺癌的化學品的工人中,一些工人可能也有吸煙史,這是肺癌的進一步誘因。 在後一種情況下,職業流行病學家必須確定哪種接觸(或哪種風險因素——化學品或煙草,或者實際上是兩者的結合)是導致正在工作的工人群體患肺癌風險增加的原因學習了。
暴露評估
如果一項研究只能獲得工人受僱於特定行業這一事實,那麼此類研究的結果只能將健康影響與該行業聯繫起來。 同樣,如果存在關於工人職業的暴露知識,則只能就職業而言直接得出結論。 可以對化學暴露進行間接推斷,但必鬚根據具體情況評估其可靠性。 然而,如果一項研究可以訪問有關部門和/或每個工人的職位的信息,那麼就能夠得出更精細的工作經驗水平的結論。 如果流行病學家(與工業衛生學家合作)知道關於一個人工作的實際物質的信息,那麼這將是在缺乏很少可用的劑量測定的情況下可用的最佳暴露信息水平。 此外,此類研究的結果可以為行業提供更有用的信息,以創建更安全的工作場所。
直到現在,流行病學一直是一門“黑箱”學科,因為它研究的是暴露與疾病(因果鏈的兩個極端)之間的關係,而沒有考慮中間的機制步驟。 這種方法,儘管明顯缺乏改進,但卻非常有用:事實上,例如,所有已知的人類癌症原因都是通過流行病學工具發現的。
流行病學方法基於可用的記錄——調查問卷、職位或其他暴露“代理”; 這使得流行病學研究的開展和對研究結果的解釋相對簡單。
然而,近年來,隨著流行病學家面臨更複雜的問題,更粗略的暴露評估方法的局限性越來越明顯。 將我們的考慮局限於職業性癌症流行病學,由於過去的高水平接觸,已經發現了大多數眾所周知的風險因素; 每項工作的曝光次數有限; 大量暴露的工人; “代理”信息與化學品接觸(例如,製鞋工人和苯、造船廠和石棉等)之間存在明確的對應關係。 如今,情況大不相同:西方國家的暴露水平要低得多(應始終強調這一條件); 工人在同一職位(例如,農業工人)中會接觸到許多不同的化學品和混合物; 暴露工人的同類人群更難找到,而且通常人數很少; 而且,“代理”信息與實際曝光之間的對應關係逐漸變弱。 在這種情況下,由於暴露的錯誤分類,流行病學工具的敏感性降低了。
此外,流行病學依賴於“硬”終點,例如大多數隊列研究中的死亡。 然而,在研究職業暴露的潛在健康影響時,工作人員可能更願意看到不同於“人體計數”的東西。 因此,使用更直接的暴露和早期反應指標會有一些優勢。 生物標記可能只是提供了一種工具。
生物標記
使用生物標誌物,例如血液中的鉛含量或肝功能測試,在職業流行病學中並不新鮮。 然而,分子技術在流行病學研究中的應用使得使用生物標誌物評估靶器官暴露、確定易感性和確定早期疾病成為可能。
生物標誌物在職業流行病學背景下的潛在用途是:
科學界對這些用途產生了極大的熱情,但是,如上所述,使用這些新“分子工具”的方法論複雜性應該提醒人們不要過度樂觀。 化學暴露的生物標誌物(如 DNA 加合物)有幾個缺點:
比方法論上的缺點更重要的是,考慮到分子技術可能會使我們將注意力從識別外源環境中的風險轉移到識別高風險個體,然後通過測量表型、加合物負荷和獲得性突變進行個性化風險評估。 正如 McMichael 指出的那樣,這會將我們的重點轉向一種臨床評估形式,而不是公共衛生流行病學。 關注個人可能會分散我們對創造危害較小環境這一重要公共衛生目標的注意力(McMichael 1994)。
關於生物標誌物的使用出現了另外兩個重要問題:
最後,越來越多的證據表明,有害物質(尤其是致癌物)的代謝激活或失活在人群中差異很大,部分由基因決定。 此外,在低水平的職業和環境暴露下,個體間對致癌物易感性的差異可能特別重要(Vineis 等人,1994 年)。 這些發現可能會強烈影響將風險評估過程集中在最易受影響人群的監管決策(Vineis 和 Martone 1995)。
研究設計和有效性
Hernberg 關於流行病學研究設計及其在職業醫學中的應用的文章集中討論了“研究基礎”的概念,該概念被定義為隨著時間的推移人口的發病率經歷(與某些暴露相關)。 因此,研究的基礎不僅僅是一個人群(即一群人),而是這個人群在一定時期內疾病發生的經歷(Miettinen 1985,Hernberg 1992)。 如果採用這種統一的研究基礎概念,那麼重要的是要認識到不同的研究設計(例如,病例對照和隊列設計)只是從同一研究中“收集”有關暴露和疾病信息的不同方式根據; 它們不是截然不同的方法。
Sasco 關於研究設計有效性的文章闡述了混雜的定義和重要性。 研究調查人員必須始終考慮職業研究中混雜的可能性,並且永遠不能充分強調潛在混雜變量的識別是任何研究設計和分析的組成部分。 職業流行病學必須解決混雜的兩個方面:
時間和時間相關的變量,如風險年齡、日曆週期、自僱用以來的時間、自首次接觸以來的時間、接觸持續時間及其在分析階段的治療,是職業流行病學中最複雜的方法論問題。 本章不涉及它們,但指出了兩個相關的最新方法參考文獻(Pearce 1992;Robins 等人 1992)。
統計
Biggeri和Braga關於統計的文章以及本章的標題表明,統計方法離不開流行病學研究。 這是因為:(a) 對統計的正確理解可以為調查的正確設計提供有價值的見解,以及 (b) 統計和流行病學有共同的遺產,流行病學的整個定量基礎是基於概率的概念(克萊頓 1992 年;克萊頓和希爾斯 1993 年)。 在隨後的許多文章中,使用概率論證和適當的研究設計評估了假設因果關係的經驗證據和證明。 例如,重點放在估計利率或相對風險等利率風險度量上,以及圍繞這些估計構建置信區間,而不是執行概率統計檢驗(Poole 1987;Gardner 和 Altman 1989;Greenland 1990 ). 提供了使用二項分佈進行統計推理的簡要介紹。 統計數據應該是科學推理的伴侶。 但如果沒有適當設計和進行的研究,它就毫無價值。 統計學家和流行病學家意識到,方法的選擇決定了我們進行觀察的內容和程度。 因此,深思熟慮地選擇設計選項對於確保有效觀察至關重要。
倫理
Vineis 的最後一篇文章解決了流行病學研究中的倫理問題。 本簡介中要提到的要點是指流行病學作為一門學科,根據定義需要採取預防措施。 關於保護工人和廣大民眾的具體倫理問題需要承認:
職業流行病學培訓
具有不同背景的人可以找到進入職業流行病學專業的途徑。 在該領域的專業人士中,醫學、護理和統計學是更有可能出現的一些背景。 在北美,大約一半受過培訓的流行病學家具有科學背景,而另一半則沿著醫學博士的道路前進。 在北美以外的國家,大多數職業流行病學專家都晉升為醫學博士。 在北美,接受過醫學培訓的人往往被認為是“內容專家”,而那些通過科學途徑接受過培訓的人則被認為是“方法論專家”。 內容專家與方法專家合作以設計和進行盡可能最好的研究通常是有利的。
職業流行病學專業不僅需要流行病學方法、統計學和計算機方面的知識,還需要毒理學、工業衛生和疾病登記方面的知識(Merletti 和 Comba,1992 年)。 由於大型研究可能需要與疾病登記處聯繫,因此了解人口數據來源很有用。 勞工和公司組織的知識也很重要。 碩士論文和博士論文培訓使學生具備在工人中進行大量基於記錄和訪談的研究所需的知識。
歸因於職業的疾病比例
至少在癌症的另一部分涵蓋了一組暴露工人或一般人群中可歸因於職業暴露的疾病比例 百科全書. 在這裡我們應該記住,如果計算估計值,它應該針對特定疾病(以及癌症情況下的特定部位)、特定時間段和特定地理區域。 此外,它應該基於對暴露人群比例和暴露程度的準確測量。 這意味著可歸因於職業的疾病比例可能從某些人群中的非常低或零到位於工業區的其他人群中的非常高,例如,多達 40% 的肺癌可歸因於職業暴露(Vineis和 Simonato 1991)。 沒有基於對精心設計的流行病學研究的詳細審查的估計充其量只能被視為有根據的猜測,並且價值有限。
危險產業轉移
大多數流行病學研究都是在發達國家進行的,在過去幾十年裡,發達國家對已知職業危害的監管和控制降低了患病風險。 然而,與此同時,大量危險產業轉移到了發展中國家(Jeyaratnam 1994)。 以前在美國或歐洲被禁止的化學品現在在發展中國家生產。 例如,石棉加工已從美國轉移到墨西哥,聯苯胺生產從歐洲國家轉移到前南斯拉夫和韓國(Simonato 1986 年;LaDou 1991 年;Pearce 等人 1994 年)。
發展中國家職業風險水平和工作條件的一個間接標誌是其中一些國家正在流行急性中毒。 根據一項評估,全世界每年約有 20,000 人死於急性殺蟲劑中毒,但這很可能被嚴重低估了(Kogevinas 等人,1994 年)。 據估計,99% 的急性農藥中毒死亡發生在發展中國家,而這些國家僅使用了世界上 20% 的農用化學品(Kogevinas 等人,1994 年)。 這就是說,即使流行病學研究似乎表明職業危害有所減少,這也可能僅僅是因為大多數此類研究都是在發達國家進行的。 職業危害可能只是轉移到了發展中國家,全世界的職業暴露總負擔可能增加了(Vineis 等人,1995 年)。
獸醫流行病學
出於顯而易見的原因,獸醫流行病學與職業健康和職業流行病學並不直接相關。 然而,疾病的環境和職業原因的線索可能來自對動物的流行病學研究,原因如下:
獸醫談論獸醫學的流行病學革命(Schwabe 1993),並且出現了有關該學科的教科書(Thrusfield 1986;Martin 等人 1987)。 當然,環境和職業危害的線索來自人類和動物流行病學家的共同努力。 其中,苯氧基除草劑對綿羊和狗的影響(Newell 等人,1984 年;Hayes 等人,1990 年)、磁場(Reif 等人,1995 年)和被類石棉化合物污染的殺蟲劑(尤其是跳蚤製劑)對狗的影響(Glickman et al. 1983) 是顯著的貢獻。
參與式研究、交流結果和預防
重要的是要認識到職業健康領域的許多流行病學研究都是通過工人自身的經驗和關注而發起的(Olsen 等人,1991 年)。 通常,那些曾經和/或現在暴露在外的工人在研究證實之前很久就認為有什麼地方不對勁。 職業流行病學可以被認為是一種“理解”工人經歷、以系統方式收集和分組數據並推斷導致其健康不良的職業原因的方法。 此外,工人本身、他們的代表和負責工人健康的人是解釋所收集數據的最合適人選。 因此,他們應該始終積極參與在工作場所進行的任何調查。 只有他們的直接參與才能保證研究人員離開後工作場所仍然安全。 任何研究的目的都是利用研究結果預防疾病和殘疾,而這項研究的成功在很大程度上取決於確保暴露者參與獲得和解釋研究結果。 當工人尋求因工作場所暴露造成的損害賠償時,研究結果在訴訟過程中的作用和使用超出了本章的範圍。 對於這方面的一些見解,讀者可以參考別處(Soskolne、Lilienfeld 和 Black 1994)。
確保開展職業流行病學研究的參與式方法在一些地方已成為標準做法,其形式是建立指導委員會,以監督研究計劃從開始到完成的整個過程。 這些委員會的結構是多方的,包括勞工、科學、管理和/或政府。 在研究過程中有所有利益相關者團體的代表,由於他們的可信度提高,結果的交流將變得更加有效,因為“他們自己的人”會一直監督研究並將調查結果傳達給他或她各自的選區。 這樣,就有可能實現最大程度的有效預防。
職業健康研究中的這些和其他參與式方法是在那些經歷過或受到與暴露有關的關注問題影響的人的參與下進行的。 這應該在所有流行病學研究中更常見(Laurell 等人,1992 年)。 重要的是要記住,雖然在流行病學工作中,分析的目標是估計風險的大小和分佈,但在參與式研究中,風險的可預防性也是一個目標(Loewenson 和 Biocca 1995)。 流行病學和有效預防的這種互補性是本次活動信息的一部分 百科全書 和這一章。
保持公共衛生相關性
儘管流行病學方法、數據分析以及暴露評估和測量(例如新的分子生物學技術)方面的新發展受到歡迎並且很重要,但它們也可以促進以個人而非人群為重點的還原論方法。 有人說:
......流行病學在很大程度上已不再作為理解人群疾病原因的多學科方法的一部分發揮作用,而是成為一套衡量個人暴露與疾病關聯的通用方法......目前忽視了社會,經濟,文化、歷史、政治和其他人口因素作為疾病的主要原因……流行病學必須重新融入公共衛生,並且必須重新發現人口觀點(Pearce 1996)。
職業和環境流行病學家可以發揮重要作用,不僅在開發新的流行病學方法和這些方法的應用方面,而且在確保這些方法始終從適當的人口角度整合方面。
暴露評估是通過流行病學調查識別工作場所危害的關鍵步驟。 暴露評估過程可細分為一系列活動。 這些包括:
由於暴露評估的不足,職業健康研究經常受到批評。 不足之處可能導致暴露的差異或非差異錯誤分類以及隨後的暴露效應分析中的偏差或精度損失。 最近幾次國際會議和專門討論該主題的文本證明了改善這種情況的努力(ACGIH 1991 年;Armstrong 等人 1992 年;流行病學職業暴露回顧性評估會議論文集 1995 年)。 顯然,技術發展為推進暴露評估提供了新的機會。 這些發展包括分析儀器的改進、對藥代動力學過程的更好理解以及新的暴露生物標誌物的發現。 由於職業健康研究通常依賴於沒有進行特定監測的歷史暴露信息,因此對回顧性暴露評估的需求為這些研究增加了額外的複雜性。 然而,改進的評估標準和確保此類評估可靠性的標準仍在繼續開發中(Siemiatycki 等人,1986 年)。 當然,前瞻性暴露評估更容易得到驗證。
術語 曝光 是指藥劑在個體和環境之間的邊界處的濃度。 當已知代理人出現在工作環境中並且有合理的預期員工會與該代理人接觸時,通常會假定接觸。 暴露可以表示為 8 小時時間加權平均 (TWA) 濃度,這是對 8 小時工作班次的平均暴露強度的度量。 峰值濃度是較短時間段(例如 15 分鐘)內的平均強度。 累積暴露量是平均強度和持續時間的乘積(例如,平均 8 小時 TWA 濃度乘以在該平均濃度下工作的年數)。 根據研究的性質和感興趣的健康結果,可能需要評估峰值、平均強度、累積或滯後暴露。
相比之下, 劑量 指單位時間內藥劑的沉積或吸收。 可以通過將環境測量數據與關於呼吸率和皮膚滲透等因素的標准假設相結合來估計藥劑的劑量或每日攝入量。 或者,可以根據生物監測數據估計攝入量。 理想情況下,劑量將在感興趣的目標器官處測量。
重要的暴露評估因素包括:
這些包括工作活動的身體水平和個人先前的健康狀況。 在評估暴露於具有持久性或易於生物累積的物質(例如,某些金屬、放射性核素或穩定的有機化合物)時,應特別小心。 使用這些材料,即使環境濃度看起來很低,體內負擔也可能會不知不覺地增加。
雖然情況可能相當複雜,但通常情況並非如此。 當然,許多對識別職業危害的有價值的貢獻來自使用常識性方法進行暴露評估的研究。 有助於識別和分類暴露的信息來源包括:
盡可能詳細地對個人暴露進行分類有幾個優點。 顯然,如果相關暴露得到充分描述,研究的信息量將得到增強。 其次,研究結果的可信度可能會增加,因為可以更令人滿意地解決混雜的可能性。 例如,參考對象和暴露個體在暴露狀態方面會有所不同,但也可能相對於感興趣疾病的其他測量和未測量解釋因素有所不同。 然而,如果可以在研究人群中建立暴露梯度,則相同程度的混雜將不太可能在暴露亞組中持續存在,從而加強整體研究結果。
職位曝光矩陣
一種更實用和經常使用的暴露評估方法是根據職位間接估計暴露。 指某東西的用途 工作接觸矩陣 當有完整的工作經歷並且與正在研究的工作相關的任務和接觸具有合理的穩定性時,這種方法可能是有效的。 在最廣泛的範圍內,標準行業和職位分組是根據定期收集的人口普查數據或死亡證明上提供的職業數據設計的。 不幸的是,這些大型記錄系統中維護的信息通常僅限於“當前”或“通常”的職業。 此外,由於標準分組沒有考慮到特定工作場所的條件,因此通常必須將它們視為粗略的暴露替代指標。
對於基於社區和註冊的病例對照研究,通過利用專家意見將通過個人訪談獲得的工作歷史數據轉化為可能接觸特定藥物的半定量評估,已經實現了更詳細的接觸評估(Siemiatycki 等人,1986 年) ). 專家,如化學家和工業衛生學家,由於他們對各種工業過程的知識和熟悉程度,被選中協助進行暴露評估。 通過將詳細的問卷數據與工業流程知識相結合,這種方法有助於描述工作設施之間的暴露差異。
工作暴露矩陣方法也已成功用於特定行業和公司的研究(Gamble 和 Spirtas 1976)。 個人工作經歷(每個員工過去的部門和工作分配的時間順序列表)通常保留在公司人事檔案中,並且在可用時為員工在該工廠工作時提供完整的工作經歷。 可以通過對研究參與者的個人訪談來擴展這些數據。 下一步是清點研究期間使用的所有職位名稱和部門或工作區域名稱。 當生產、維護、研究、工程、工廠支持服務和行政工作都隨著時間的推移(通常是幾十年)考慮時,這些可能很容易在大型、多過程設施或跨公司的行業內達到數百甚至數千個,允許改變工業過程。 通過創建所有工作歷史記錄的計算機文件,然後使用編輯例程來標準化職位術語,可以促進數據整合。 那些涉及相對同質風險的工作可以結合起來,以簡化將風險與個別工作聯繫起來的過程。 然而,工作和工作地點的分組應盡可能得到根據合理的抽樣策略收集的測量數據的支持。
即使使用計算機化的工作歷史,將暴露數據與個人進行追溯關聯也可能是一項艱鉅的任務。 當然,隨著技術的變化、產品需求的變化和新法規的出台,工作場所的條件也會發生變化。 許多行業的產品配方和季節性生產模式也可能發生變化。 可能會保留有關某些更改的永久記錄。 但是,不太可能保留有關季節性和其他邊際過程和生產變化的記錄。 員工也可以接受培訓以執行多項工作,然後隨著生產需求的變化在工作之間輪換。 所有這些情況都增加了員工暴露情況的複雜性。 儘管如此,也有一些工作環境多年來一直保持相對不變。 歸根結底,每個工作環境都必鬚根據其自身的情況進行評估。
最終,有必要在一項研究中總結每個人的工作生活接觸史。 已證明對風險的最終暴露效應測量有相當大的影響(Suarez-Almazor 等人,1992 年),因此在選擇最合適的暴露匯總測量時必須非常小心。
工業衛生——環境測量
監測工作暴露是保護員工健康的一項基本持續活動。 因此,在計劃進行流行病學研究時,工業衛生記錄可能已經存在。 如果是這樣,則應對這些數據進行審查,以確定目標人群的覆蓋程度、文件中顯示了多少年的數據,以及測量與工作、工作區域和個人相關聯的難易程度。 這些決定將有助於評估流行病學研究的可行性,並有助於確定可以通過額外的暴露抽樣來彌補的數據差距。
如何最好地將測量數據與特定的工作和個人聯繫起來是一個特別重要的問題。 區域和呼吸區採樣可能有助於工業衛生學家識別排放源以採取糾正措施,但在描述實際員工暴露特徵時可能用處不大,除非對員工工作活動進行了仔細的時間研究。 例如,持續的區域監測可以識別一天中特定時間的偏移暴露,但問題仍然是員工當時是否在工作區域。
只要在代表性條件下進行採樣,適當考慮個人防護裝備的使用,並且每天的工作任務和工藝條件相對恆定,個人採樣數據通常可以提供更準確的員工暴露估計。 通過使用個人標識符,可以很容易地將個人樣本與個別員工聯繫起來。 這些數據可能會推廣到從事相同工作的其他員工,並推廣到其他有保證的時間段。 然而,根據他們自己的經驗,Rappaport 等人。 (1993) 警告說,即使在被分配到被認為是同質暴露組的員工中,暴露濃度也可能存在很大差異。 同樣,在決定是否可以假定同質暴露組時需要專家判斷。
研究人員已經成功地將工作暴露矩陣方法與環境測量數據的利用相結合,以估計矩陣單元格內的暴露。 當發現缺少測量數據時,可以通過使用暴露模型來填補數據空白。 一般來說,這涉及開發一個模型,將環境濃度與更容易評估的暴露濃度決定因素(例如,生產量、設施的物理特性,包括排氣通風系統的使用、藥劑揮發性和工作活動的性質)聯繫起來。 該模型是為具有已知環境濃度的工作環境構建的,然後用於估計缺乏測量數據但具有成分和產量等參數信息的類似工作環境中的濃度。 這種方法可能特別有助於暴露的回顧性估計。
另一個重要的評估問題是接觸混合物的處理。 首先,從分析的角度來看,單獨檢測化學相關化合物和消除樣品中存在的其他物質的干擾可能不在分析程序的能力範圍內。 需要評估用於提供測量數據的分析程序的各種局限性,並相應地修改研究目標。 其次,可能某些代理人幾乎總是一起使用,因此在所研究的整個工作環境中以大致相同的相對比例出現。 在這種情況下,內部統計分析 本身 將無助於區分效應是由於一種或另一種藥物引起的還是由於藥物的組合引起的。 此類判斷只能基於對未發生相同藥物組合的外部研究的審查。 最後,在根據產品規格互換使用不同材料的情況下(例如,使用不同的著色劑以獲得所需的顏色對比度),可能無法將效果歸因於任何特定的試劑。
生物監測
生物標誌物是可以在人體組織、細胞或體液等生物介質中測量的分子、生化或細胞變化。 開發暴露生物標誌物的一個主要原因是提供對特定藥劑的內部劑量的估計。 當可能有多種接觸途徑(例如吸入和皮膚吸收)、間歇性佩戴防護裝備或接觸條件不可預測時,這種方法特別有用。 當已知感興趣的試劑具有相對較長的生物半衰期時,生物監測可能特別有利。 從統計學的角度來看,根據環境變化的程度,半衰期短至 1991 小時的藥劑可以看出生物監測相對於空氣監測的優勢(Droz 和 Wu XNUMX)。 氯化二噁英等材料的超長半衰期(以年為單位)使這些化合物成為生物監測的理想候選物。 與測量空氣濃度的分析方法一樣,必須注意潛在的干擾。 例如,在使用特定代謝物作為生物標誌物之前,應確定其他常見物質(例如某些藥物和香煙煙霧中所含的物質)是否可以代謝到相同的終點。 一般而言,在將生物監測用作暴露評估的基礎之前,需要了解藥物的藥代動力學基礎知識。
最常見的測量點包括肺泡空氣、尿液和血液。 肺泡空氣樣本可能有助於表徵在收集樣本後幾分鐘或幾小時內發生的短期高溶劑暴露。 通常收集尿樣以確定目標化合物代謝物的排泄率。 可收集血樣用於直接測量化合物、測量代謝物或測定蛋白質或 DNA 加合物(例如,白蛋白或血紅蛋白加合物,以及循環淋巴細胞中的 DNA 加合物)。 也可以對可接近的組織細胞(例如來自口腔頰區的上皮細胞)進行取樣,以鑑定 DNA 加合物。
紅細胞和血漿中膽鹼酯酶活性的測定舉例說明了使用生化改變作為暴露量度。 有機磷殺蟲劑抑制膽鹼酯酶活性,因此在可能接觸這些化合物之前和之後測量該活性可以作為接觸強度的有用指標。 然而,隨著生物改變範圍的發展,區分暴露的生物標誌物和影響的生物標誌物變得更加困難。 一般而言,效應量度對於感興趣的物質往往是非特異性的,因此,可能需要評估其他可能的效應解釋,以支持將該參數用作暴露量度。 暴露量度應該直接與感興趣的代理相關聯,或者應該有一個合理的基礎將任何間接測量與代理相關聯。 儘管有這些資格,生物監測作為一種改進暴露評估以支持流行病學研究的手段仍有很大希望。
結論
在職業流行病學研究中進行比較時,需要將一組接觸過的工人與一組沒有接觸過的工人進行比較。 這種區分是粗略的,但有助於識別問題區域。 然而,顯然,暴露的測量越精細,研究就越有用,特別是在確定和製定適當的針對性干預計劃的能力方面。
研究人員很幸運,因為他們可以使用詳細的工人工作生活經歷年表,這些年表提供了對他們在一段時間內擔任的工作的歷史回顧。 對於這些工人來說 工作接觸矩陣 然後可以設置允許工人經歷的每一次工作變化都與特定的暴露信息相關聯。
必須總結詳細的暴露歷史以用於分析目的,以確定是否存在可能與工作場所的健康和安全問題相關的明顯模式。 我們可以想像一個工人在他或她的工作生涯中經歷過的 20 次工作變動的列表。 然後有幾種替代方法可以總結接觸細節(對於本例中的 20 個工作變動中的每一個),同時考慮接觸的持續時間和/或濃度/劑量/等級。
然而,重要的是要注意,根據所選擇的方法,一項研究可能會得出不同的結論(Suarez-Almazor 等人,1992 年)。 表 1 顯示了五個總結工作生活暴露測量的示例。
表 1. 五個選定的工作生活暴露總結度量的公式和維度或單位
暴露測量 |
公式 |
尺寸/單位 |
累積暴露指數 (CEI) |
Σ(等級 x 暴露時間) |
年級和時間 |
平均等級 (MG) |
Σ(等級 x 暴露時間)/總暴露時間 |
級 |
有史以來最高等級 (HG) |
暴露 ≥ 7 天的最高等級 |
級 |
時間加權平均 (TWA) 等級 |
Σ(等級 x 暴露時間)/總使用時間 |
級 |
暴露總時間 (TTE) |
Σ 曝光時間 |
時間 |
改編自 Suarez-Almazor 等人。 1992.
累積暴露指數。 累積暴露指數 (CEI) 相當於毒理學研究中的“劑量”,表示在整個工作生命週期內,每個連續職稱的暴露等級和暴露持續時間的乘積之和。 它的單位包括時間。
平均成績。 平均等級 (MG) 累積每個連續職位(即 CEI)的接觸等級和接觸持續時間的乘積,然後除以任何大於零的等級的總接觸時間。 MG 在其單位中獨立於時間; 長時間高濃度暴露的人的簡要措施與短時間高濃度暴露的人相似。 在病例對照設計的任何匹配集中,MG 是每單位暴露時間的平均暴露等級。 它是實際接觸所考慮的代理人的時間的平均等級。
有史以來最高等級。 有史以來最高等級 (HG) 是通過掃描工人在至少 XNUMX 天的觀察期內最高等級分配的工作歷史來確定的。 HG 可能會歪曲一個人的工作生活暴露,因為根據其公式,它基於最大化而不是平均程序,因此獨立於其單位的暴露持續時間。
時間加權平均成績。 時間加權平均 (TWA) 等級是累積暴露指數 (CEI) 除以總使用時間。 在病例對照設計的任何匹配組中,TWA 成績平均佔總使用時間。 它與 MG 不同,MG 僅對實際曝光的總時間取平均值。 因此,TWA 等級可以被視為在整個就業期間每單位時間的平均暴露,而不管暴露 本身.
暴露的總時間。 總曝光時間 (TTE) 以時間為單位累積與曝光相關的所有時間段。 TTE 因其簡單性而具有吸引力。 然而,人們普遍認為,健康影響不僅與化學品接觸的持續時間有關,而且與接觸的強度(即濃度或等級)有關。
顯然,匯總暴露測量的效用取決於它賦予暴露持續時間或暴露濃度或兩者的相應權重。 因此,不同的措施可能會產生不同的結果(Walker 和 Blettner 1985)。 理想情況下,所選擇的總結措施應基於一組關於所研究的藥物或疾病關聯的假定生物學機制的可靠假設(Smith 1987)。 然而,這個過程並不總是可行的。 很多時候,暴露持續時間或所研究藥物濃度的生物學效應是未知的。 在這種情況下,使用不同的暴露措施可能有助於提出暴露發揮其作用的機制。
建議在沒有經過驗證的暴露評估模型的情況下,使用各種總結工作生活暴露措施來估計風險。 這種方法將有助於比較不同研究的結果。
流行病學涉及測量疾病的發生和量化疾病與暴露之間的關聯。
疾病發生的措施
疾病的發生可以通過以下方式衡量 頻率 (計數)但更好地描述為 價格,它由三個要素組成:受影響的人數(分子)、受影響人來自的源或基人口(即風險人口)的人數,以及覆蓋的時間段。 比率的分母是源人口經歷的總人時。 比率允許在不同規模的人口之間進行比單獨計數更多的信息比較。 風險,個體在指定時間段內發生疾病的概率,是一個比例,範圍從0到1,不是比率 本身. 攻擊速度,即在特定時間段內受影響的人口比例,在技術上是一種風險衡量標準,而不是比率。
疾病特異性發病率包括 發生率,指的是新診斷出所關注疾病的人數。 流行 指的是現有案件的數量。 死亡 指死亡人數。
發生率 定義為指定時間段內新診斷病例數,而 發病率 是這個數字除以來源人口經歷的總人時(表 1)。 對於癌症,發病率通常表示為每 100,000 人的年發病率。 其他更常見疾病的發病率可以按較少人數表示。 例如,出生缺陷率通常表示為每 1,000 名活產嬰兒。 累計發病率,即在指定時間段內成為病例的人數比例,是衡量人口平均風險的指標。
表 1. 疾病發生的度量:五年期間觀察的假設人群
新增確診病例 |
10 |
先前確診的活體病例 |
12 |
死亡,所有原因* |
5 |
死亡,感興趣的疾病 |
3 |
人口中的人 |
100 |
觀察年數 |
5 |
發生率 |
10人 |
年發病率 |
|
點流行率(第 5 年末) |
(10 + 12 - 3) = 19 人 |
期間流行率(五年期間) |
(10 + 12) = 22 人 |
年死亡率 |
|
年死亡率 |
*為簡化計算,本例假設所有死亡都發生在五年期末,因此人口中所有 100 人都活了整整五年。
流行 包括 點流行度,某個時間點的疾病病例數,以及 經期患病率,已知在特定時期內某個時間存在的疾病病例總數。
死亡,它關注的是死亡而不是新診斷的疾病病例,它反映了導致疾病的因素以及與醫療質量相關的因素,例如篩查、獲得醫療服務和有效治療的可用性。 因此,當基於發病率而不是死亡率數據時,假設產生的努力和病因學研究可能會提供更多信息並且更容易解釋。 然而,與發病率數據相比,大量人群的死亡率數據通常更容易獲得。
術語 死亡率 通常被認為是指所有原因造成的總死亡率,而 死亡率 是某一特定原因造成的死亡率。 對於給定的疾病, 病死率 (技術上是比例,而不是比率)是在特定時間段內死於該疾病的人數除以患有該疾病的人數。 病死率的補數是 存活率. 五年生存率是癌症等慢性病的共同基準。
疾病的發生可能因人口亞組或時間而異。 不考慮任何亞組的整個人群的疾病測量稱為 粗率. 例如,所有年齡組的總發病率是粗率。 各個年齡段的費率是 特定年齡比率. 要比較兩個或多個具有不同年齡分佈的人群, 年齡調整 (或者, 年齡標準化) 應計算每個人口的比率,方法是將每個特定年齡的比率乘以該年齡組的標准人口(例如,研究中的人口之一,1970 年美國人口)的百分比,然後將所有年齡組相加產生一個整體的年齡調整率。 如果已知特定類別的比率,則可以根據年齡以外的因素調整比率,例如種族、性別或吸煙狀況。
描述性數據的監測和評估可以為疾病病因學提供線索,確定可能適合干預或篩查計劃的高風險亞群,並提供有關此類計劃有效性的數據。 用於監測活動的信息來源包括死亡證明、醫療記錄、癌症登記、其他疾病登記(例如,出生缺陷登記、終末期腎病登記)、職業暴露登記、健康或殘疾保險記錄和工傷賠償記錄。
協會措施
流行病學試圖識別和量化影響疾病的因素。 在最簡單的方法中,將暴露於可疑因素的人的疾病發生率與未暴露的人的疾病發生率進行比較。 暴露與疾病之間關聯的程度可以用以下任一方式表示 絕對 or 相對的 條款。 (另見“案例研究:措施”).
絕對效應的衡量標準是 利率差異 風險差異 (表 2)。 一種 率差 是一個速率減去第二個速率。 例如,如果接觸苯的工人的白血病發病率為每 72 萬人年 100,000 例,而未接觸苯的工人的白血病發病率為每 12 萬人年 100,000 例,那麼比率差異為每 60 萬人年 100,000 例。 一種 風險差異 是風險或累積發生率的差異,範圍從 -1 到 1。
表 2. 隊列研究的關聯度量
機殼 |
風險人年 |
每 100,000 的費率 |
|
外露 |
100 |
20,000 |
500 |
未曝光 |
200 |
80,000 |
250 |
Total |
300 |
100,000 |
300 |
差價 (RD) = 500/100,000 - 250/100,000
= 250/100,000 每年
(146.06/100,000 - 353.94/100,000)*
比率(或相對風險)(RR)=
暴露的歸因風險(ARe) = 100/20,000 - 200/80,000
= 250/100,000 每年
暴露的歸因風險百分比(ARe%)=
人口歸因風險 (PAR) = 300/100,000 - 200/80,000
= 50/100,000 每年
人口歸因風險百分比 (PAR%) =
* 括號中的 95% 置信區間是使用方框中的公式計算得出的。
相對影響 基於利率或風險措施的比率,而不是差異。 一種 比率 是一個人群中的比率與另一個人群中的比率。 比率也被稱為 風險比, 相對風險, 相對率和 發生率 死亡) 比率. 該度量是無量綱的,範圍從 0 到無窮大。 當兩組的比率相似時(即暴露沒有影響), 比率 等於統一 (1)。 增加風險的敞口會產生大於 0 的比率,而保護性因素會產生 1 到 XNUMX 之間的比率。 超額相對風險 是相對風險減 1。例如,1.4 的相對風險也可以表示為 40% 的超額相對風險。
在病例對照研究(也稱為病例參照研究)中,確定患有疾病的人(病例)和未患病的人(對照或參照物)。 比較兩組過去的暴露情況。 將成為暴露病例的機率與成為暴露對照的機率進行比較。 無法獲得暴露人群和未暴露人群的來源人口的完整計數,因此無法計算發病率。 相反,可以通過計算將暴露的案例與暴露的控件進行比較 相對機率,或 比值比 (表3)。
表 3. 病例對照研究的相關性測量:暴露於木屑和鼻腔和鼻竇腺癌
機殼 |
Controls |
|
外露 |
18 |
55 |
未曝光 |
5 |
140 |
Total |
23 |
195 |
相對優勢(優勢比)(OR)=
暴露的歸因風險百分比()=
人口歸因風險百分比 (PAR%) =
哪裡 = 暴露控制的比例 = 55/195 = 0.28
* 括號中的 95% 置信區間是使用背頁方框中的公式計算得出的。
資料來源:改編自 Hayes 等人。 1986.
相對效果測量比絕對測量更頻繁地用於報告關聯強度。 然而,絕對指標可以更好地表明協會對公共衛生的影響。 一種常見疾病(如心髒病)的相對小幅增加可能會影響更多的人(風險差異大)並且對公眾健康的影響大於罕見疾病(如肝臟血管肉瘤。
顯著性檢驗
統計顯著性檢驗通常對效應量度進行,以評估觀察到的效應與零假設(即無效應)不同的可能性。 雖然許多研究,特別是在生物醫學研究的其他領域,可能通過以下方式表達重要性 p 值, 流行病學研究通常呈現 置信區間 (CI)(也稱為 置信限度). 例如,95% 的置信區間是效果測量值的範圍,其中包括從研究數據中獲得的估計測量值以及包含真實值的概率為 95% 的值。 區間外的值被認為不太可能包括真實的效果測量值。 如果比率的 CI 包括單位,則被比較的組之間沒有統計顯著差異。
置信區間比單獨的 p 值更能提供信息。 p 值的大小由兩個原因中的一個或兩個決定。 關聯的度量(例如比率、風險差異)很大,或者研究的人群很大。 例如,在大量人群中觀察到的疾病發生率的微小差異可能會產生非常顯著的 p 值。 無法僅從 p 值確定大 p 值的原因。 然而,置信區間使我們能夠區分這兩個因素。 首先,效果的大小可以通過效果度量的值和區間包含的數字來辨別。 例如,風險比率越大,表明效果越強。 其次,人口規模影響置信區間的寬度。 具有統計不穩定估計值的小群體比較大群體產生更寬的置信區間。
選擇用於表達結果可變性(“統計顯著性”)的置信水平是任意的,但傳統上為 95%,對應於 0.05 的 p 值。 95% 的置信區間有 95% 的概率包含效果的真實度量。 偶爾會使用其他置信水平,例如 90%。
暴露可以是二分的(例如,暴露的和未暴露的),或者可能涉及多個暴露水平。 影響措施(即響應)可能因接觸程度而異。 評估 曝光反應 關係是解釋流行病學數據的重要部分。 動物研究中暴露-反應的類比是“劑量-反應”。 如果響應隨著暴露水平的增加而增加,則與未觀察到趨勢相比,關聯更有可能是因果關係。 評估暴露-反應關係的統計檢驗包括 Mantel 擴展檢驗和卡方趨勢檢驗。
標準化
為考慮除感興趣的主要暴露和疾病以外的因素,關聯措施可能是 標準化 通過分層或回歸技術。 分層意味著根據因素將人口分成同質組(例如,性別組、年齡組、吸煙組)。 計算每個層的風險比或優勢比,併計算風險比或優勢比的總體加權平均值。 這些總體值反映了主要暴露與疾病之間的關聯,並針對分層因素進行了調整,即與去除分層因素的影響的關聯。
A 標準化比率 (SRR) 是兩個標準化利率的比率。 換句話說,SRR 是特定層級比率的加權平均值,其中每個層級的權重是非暴露組或參照組的人時分佈。 如果使用相同的權重,則可以比較兩個或更多組的 SRR。 可以為 SRR 構建置信區間,就像比率一樣。
標準化死亡率 (SMR) 是特定年齡比率的加權平均值,其中權重(例如,處於風險中的人-時間)來自研究組,比率來自參考人群,這與 SRR 中的情況相反。 通常的參考人群是一般人群,其死亡率可能很容易獲得併且基於大量數據,因此比使用來自非暴露隊列或研究中的職業人群亞組的死亡率更穩定。 使用隊列而不是參考人群的權重稱為間接標準化。 SMR 是隊列中觀察到的死亡人數與預期人數的比率,基於參考人群的比率(該比率通常乘以 100 以供呈現)。 如果不存在關聯,則 SMR 等於 100。需要注意的是,由於比率來自參考人群,權重來自研究組,因此兩個或多個 SMR 往往不具有可比性。 這種不可比性在流行病學數據的解釋中經常被遺忘,並可能得出錯誤的結論。
健康工人效應
職業人群的總死亡率低於一般人群是很常見的,即使工人因工作場所暴露而導致特定死因的風險增加。 這種現象,稱為 健康工人效應,反映了這樣一個事實,即任何一組就業人員平均都可能比一般人群更健康,其中包括工人和因疾病和殘疾而無法工作的人。 一般人群的總體死亡率往往高於工人。 效果因死亡原因而異。 例如,它對癌症的重要性一般不如對慢性阻塞性肺病的重要性。 這樣做的一個原因是,大多數癌症很可能不會因為在較年輕的時候選擇工作/職業而對癌症有任何傾向。 特定工人群體中的健康工人效應往往會隨著時間的推移而減弱。
比例死亡率
有時無法獲得隊列的完整列表(即處於危險中的人時),並且只有關於隊列經歷的死亡或死亡的某些子集的信息(例如,退休人員和在職員工中的死亡,而不是工人中的死亡)在有資格領取養老金之前離職的人)。 人年的計算需要特殊的方法來處理人次評估,包括生命表方法。 如果沒有所有隊列成員的總人次信息,無論疾病狀態如何,都無法計算 SMR 和 SRR。 反而, 比例死亡率 (PMR) 可以使用。 PMR 是觀察到的特定原因導致的死亡人數與預期人數的比率,基於參考人群中特定原因導致的總死亡人數的比例乘以研究中的總死亡人數組,乘以 100。
因為所有原因導致的死亡比例總和必須等於 1 (PMR=100),所以一些 PMR 可能看起來過多,但實際上由於其他死亡原因的實際不足而被人為誇大。 同樣,一些明顯的缺陷可能僅僅反映了其他死因的實際過剩。 例如,如果空中殺蟲劑噴灑器因事故造成的實際死亡人數過多,則所有原因的 PMR 加起來等於 100 的數學要求可能會導致某些死亡原因出現不足,即使死亡率過高。 為了改善這一潛在問題,主要對癌症感興趣的研究人員可以計算出 比例癌症死亡率 (PCMR)。 PCMR 將觀察到的癌症死亡人數與預期人數進行比較,根據參考人群中感興趣的癌症的總癌症死亡人數(而非所有死亡人數)的比例乘以研究組的癌症死亡總人數,再乘以100. 因此,PCMR 不會受到非癌症死因異常(過度或不足)的影響,例如事故、心髒病或非惡性肺病。
可以更好地分析 PMR 研究 死亡率比值比 (MORs),本質上是分析數據,就好像它們來自病例對照研究一樣。 “對照”是被認為與所研究的暴露無關的所有死亡的子集中的死亡。 例如,如果研究的主要興趣是癌症,則可以計算死亡率比值比,比較癌症死亡中的暴露與心血管死亡中的暴露。 這種方法與 PCMR 一樣,避免了當一種死因的波動影響另一種死因的明顯風險時出現的 PMR 問題,僅僅是因為總體 PMR 必須等於 100。然而,控制死因的選擇是至關重要的. 如上所述,它們一定與暴露無關,但對於許多潛在的控制疾病,暴露與疾病之間可能存在的關係可能並不為人所知。
歸因風險
如果觀察到的暴露與疾病之間的關聯是因果關係,則可以使用一些措施來表達可歸因於暴露的疾病數量。 這 暴露的歸因風險 (ARe) 是暴露的疾病率減去未暴露的疾病率。 由於在病例對照研究中無法直接測量發病率,因此 ARe 僅可計算隊列研究。 一個相關的、更直觀的度量, 暴露的歸因風險百分比 (ARe%), 可以從任一研究設計中獲得。 增強現實e% 是暴露人群中可歸因於暴露的病例比例(公式見表 2 和表 3)。 增強現實e% 是比率(或優勢比)減去 1,除以比率(或優勢比),再乘以 100。
人口歸因風險 (PAR)和 人口歸因風險百分比 (PAR%),或 病因分數, 表示由暴露和未暴露的人組成的總人口中的疾病數量,如果觀察到的關聯是因果關係,則歸因於暴露。 PAR 可以從隊列研究中獲得(表 28.3),PAR% 可以在隊列研究和病例對照研究中計算(表 2 和表 3)。
代表性
已經描述了幾種風險度量。 每個都假定用於計算事件的基本方法,並將這些事件的代表分配給定義的組。 當比較不同研究的結果時,了解所使用的方法對於解釋任何觀察到的差異至關重要。
流行病學家感興趣的是變量之間的關係,主要是暴露變量和結果變量。 通常,流行病學家想要確定疾病的發生是否與人群中特定物質(暴露)的存在有關。 研究這些關係的方式可能有很大差異。 人們可以識別所有暴露於該物質的人並跟踪他們以測量疾病的發病率,並將這種發病率與適當的未暴露人群中的疾病發生率進行比較。 或者,可以簡單地從暴露和未暴露的樣本中取樣,而無需對它們進行完整的列舉。 或者,作為第三種選擇,可以確定所有在規定時間段內患上某種疾病的人(“病例”)和一組合適的無病個體(病例源人群的樣本),並確定兩組之間的暴露模式是否不同。 研究參與者的隨訪是一種選擇(在所謂的縱向研究中):在這種情況下,暴露的發生和疾病發作之間存在時間滯後。 另一種選擇是人口的橫截面,在同一時間點測量暴露和疾病。
在本文中,重點關注常見的研究設計——隊列、案例參照(案例對照)和橫斷面研究。 為了為這個討論奠定基礎,考慮一個小鎮上的大型粘膠人造絲工廠。 一項關於接觸二硫化碳是否會增加心血管疾病風險的調查已經開始。 調查有幾種設計選擇,有些更明顯,有些則不太明顯。 第一個策略是確定所有接觸過二硫化碳的工人,並跟踪他們的心血管死亡率。
隊列研究
隊列研究包括研究參與者分享一個共同的事件,暴露。 經典的隊列研究確定了一組明確的暴露人群,然後對每個人進行隨訪並記錄他們的發病率和/或死亡率經歷。 除了共同的定性暴露外,隊列還應根據其他定義 資格標準,例如年齡範圍、性別(男性或女性或兩者)、最短暴露持續時間和強度、免於其他暴露等,以提高研究的有效性和效率。 根據用於測量疾病的經驗標準集,在入口處,所有隊列成員都應該沒有正在研究的疾病。
例如,如果在關於二硫化碳對冠心病發病率影響的隊列研究中,冠心病根據經驗被測量為臨床梗塞,則那些在基線時有冠狀動脈梗塞病史的人必須被排除在隊列之外。 相比之下,沒有梗死病史的心電圖異常是可以接受的。 然而,如果新的心電圖變化的出現是實證結果測量,隊列成員在基線時也應該有正常的心電圖。
應將暴露隊列的發病率(以發病率表示)或死亡率與參考隊列進行比較,參考隊列理想情況下應與暴露隊列在所有相關方面盡可能相似,除了暴露,以確定相對風險因暴露而生病或死亡。 使用類似但未暴露的隊列作為參考經驗的提供者比將暴露隊列的發病率或死亡率與年齡標準化的國家數據進行比較的常見(錯誤)做法更可取,因為一般人群甚至無法滿足最比較有效性的基本要求。 由這種比較得出的標準化發病率(或死亡率)比 (SMR) 通常會低估真實風險比,因為暴露隊列中存在偏差,導致兩個人群之間缺乏可比性。 這種比較偏差被命名為“健康工人效應”。 然而,這實際上不是真正的“影響”,而是來自負面混雜的偏差,而負面混雜又是由就業人群中的健康選擇性人員流動引起的。 (健康狀況不佳的人往往會離開或永遠不會進入“暴露”人群,他們的最終目的地通常是普通人群中的失業部分。)
因為“暴露”隊列被定義為有一定的暴露,只有 單次曝光造成的影響 (或混合暴露)可以同時研究。 另一方面,隊列設計允許研究 多種疾病同時發生. 還可以同時研究同一疾病的不同表現,例如心絞痛、ECG 變化、臨床心肌梗塞和冠狀動脈死亡率。 雖然非常適合檢驗特定假設(例如,“接觸二硫化碳會導致冠心病”),但一項隊列研究也可以回答更普遍的問題:“這種接觸會導致哪些疾病?”
例如,在一項調查鑄造工人死於肺癌風險的隊列研究中,死亡率數據來自國家死因登記冊。 雖然這項研究是為了確定鑄造廠粉塵是否會導致肺癌,但數據來源同樣努力地提供了所有其他死因的信息。 因此,可以同時研究其他可能的健康風險。
隊列研究的時間可以是回顧性的(歷史的)或前瞻性的(同期的)。 在這兩種情況下,設計結構是相同的。 在某個時間點或某個時間段對暴露人員進行全面計數,並通過定義的時間點對所有個人測量結果。 前瞻性和回顧性之間的區別在於研究的時間安排。 如果追溯,終點已經發生; 如果有希望,則必須等待。
在回顧性設計中,隊列是在過去的某個時間點定義的(例如,那些在 1 年 1961 月 1961 日接觸過的人,或者那些在 1970 年至 XNUMX 年之間從事接觸過工作的人)。 的發病率和/或死亡率 所有隊列成員 然後一直延續到現在。 雖然“全部”意味著離職人員也必須被追踪,但實際上很難達到 100% 的覆蓋率。 然而,隨訪越完整,研究就越有效。
在前瞻性設計中,隊列是在當前或未來某個時期定義的,然後將發病率追踪到未來。
在進行隊列研究時,必須留出足夠的時間進行隨訪,以便關注的終點有足夠的時間體現出來。 有時,因為過去的歷史記錄可能只有很短的一段時間,所以還是希望利用這個數據源,因為這意味著在研究結果可以被使用之前需要更短的前瞻性隨訪。可用的。 在這些情況下,回顧性和前瞻性隊列研究設計的組合可能是有效的。 表 1 顯示了呈現隊列數據的頻率表的總體佈局。
表 1. 呈現隊列數據的頻率表的總體佈局
發病率的組成部分 |
暴露隊列 |
未暴露隊列 |
疾病或死亡病例 |
c1 |
c0 |
隊列人數 |
N1 |
N0 |
暴露隊列中觀察到的患病比例計算如下:
參考隊列為:
比率則表示為:
N0 N1 通常以人-時單位而不是人數來表示 人口。 人年分別為每個人計算。 不同的人經常在一段時間內進入隊列,而不是在同一天。 因此,他們的隨訪時間從不同的日期開始。 同樣,在他們去世後,或在相關事件發生後,他們不再“處於危險之中”,不應繼續為分母貢獻人年。
如果 RR 大於 1,則暴露隊列的發病率高於參考隊列,反之亦然。 RR 是一個點估計值,應為其計算置信區間 (CI)。 研究規模越大,置信區間就越窄。 如果 RR = 1 未包含在置信區間內(例如,95% CI 為 1.4 至 5.8),則結果可被視為在所選概率水平(在此示例中,α = 0.05)下“具有統計顯著性”。
如果以一般人群作為參考人群, c0 被“預期”數字取代, E(c1 ),源自該人群的年齡標準化發病率或死亡率(即,如果未發生感興趣的暴露,隊列中可能發生的病例數)。 這產生了標準化死亡率(或發病率)比率,SMR。 因此,
同樣對於 SMR,應計算置信區間。 最好在出版物中給出此度量而不是 p 值,因為如果一般人群是參考類別,統計顯著性檢驗就沒有意義。 這種比較會帶來相當大的偏差( 健康工人效應 上面提到的)和統計顯著性檢驗,最初是為實驗研究而開發的,在存在系統誤差的情況下會產生誤導。
假設問題是石英粉塵是否會導致肺癌。 通常,石英粉塵與其他致癌物質一起出現,例如礦山中的氡子體和柴油機尾氣,或鑄造廠中的多環芳烴。 花崗岩採石場不會讓石材工人接觸這些其他致癌物。 因此,最好在花崗岩採石場僱用的石材工人中研究這個問題。
然後假設所有 2,000 名工人在 20 年至 1951 年期間受僱於 1960 個採石場,並被納入該隊列,並且他們的癌症發病率(或者僅死亡率)從第一次暴露後的十年開始被跟踪(以允許誘導時間)並且結束於 1990 年。這是對 20 名採石場工人的癌症死亡率(或發病率)進行 30 到 25 年(取決於進入年份)或者說平均 1,000 年的隨訪特別是花崗岩工人。 必須記錄每個群組成員的暴露史。 必須追踪那些離開採石場的人,並記錄他們後來的接觸史。 在所有居民都有唯一登記號碼的國家,這是一個簡單的程序,主要受國家數據保護法的約束。 如果不存在此類系統,追踪員工以進行跟進可能會非常困難。 在存在適當的死亡或疾病登記處的情況下,可以從國家死因登記處獲得所有原因、所有癌症和特定癌症部位的死亡率。 (對於癌症死亡率,國家癌症登記處是更好的來源,因為它包含更準確的診斷。此外,還可以獲得發病率(或發病率)數據。)死亡率(或癌症發病率)可以與“預期數字”,以暴露隊列的人年為基礎,根據國家比率計算得出。
假設隊列中發現 70 例肺癌致死病例,而預期數(如果沒有暴露,本應發生的數)為 35。那麼:
c1 = 70, E(c1) = 35
因此,SMR = 200,這表明暴露者死於肺癌的風險增加了兩倍。 如果可以獲得詳細的暴露數據,則可以研究癌症死亡率與不同潛伏時間(例如 10、15、20 年)、不同類型採石場(不同種類的花崗岩)、不同歷史時期、不同暴露的函數的關係強度等。 但是,70個案例不能再細分太多,因為分到每一類的數量很快就變得太少了,無法進行統計分析。
兩種類型的群組設計各有優缺點。 通常,回顧性研究只能衡量死亡率,因為通常缺乏較輕微表現的數據。 癌症登記處是一個例外,也許還有其他一些登記處,例如中風登記處和出院登記處,因為發病率數據也是可用的。 評估過去的暴露始終是一個問題,並且在回顧性研究中暴露數據通常相當薄弱。 這會導致效果掩蔽。 另一方面,由於病例已經發生,研究結果出來的時間要快得多; 比方說,兩到三年。
可以更好地規劃前瞻性隊列研究以符合研究人員的需要,並且可以準確和系統地收集暴露數據。 可以測量疾病的幾種不同表現。 暴露和結果的測量都可以重複,所有測量都可以標準化,並且可以檢查它們的有效性。 但是,如果疾病潛伏期較長(如癌症),則需要經過很長時間——甚至20到30年——才能得出研究結果。 這段時間可能會發生很多事情。 例如,研究人員的更替、用於測量選擇用於研究的植物的暴露、重塑或關閉等技術的改進。 所有這些情況都會危及研究的成功。 前瞻性研究的費用通常也高於回顧性研究,但這主要是因為測量次數多得多(重複暴露監測、臨床檢查等),而不是因為死亡登記費用更高。 因此 每單位信息的成本 不一定超過回顧性研究。 綜上所述,前瞻性研究更適合潛伏期較短、隨訪時間短的疾病,而回顧性研究更適合潛伏期長的疾病。
病例對照(或病例參考)研究
讓我們回到粘膠人造絲工廠。 如果暴露工人的名冊丟失,則回顧性隊列研究可能不可行,而前瞻性隊列研究將在很長一段時間內產生良好的結果。 然後,另一種方法是比較在規定時間段內鎮上死于冠心病的人與同一年齡組總人口的樣本。
經典的病例對照(或病例參照)設計基於從動態(開放,以成員更替為特徵)人群中抽樣。 這個人口可以是整個國家、一個地區或一個城市的人口(如我們的示例),也可以是行政上定義的患者入院人口。 定義的群體提供了案例和對照(或參考對象)。
該技術是收集所有存在於某個地點的相關疾病病例。 關鍵 及時(普遍情況),或在規定的時間內發生 期 時間(事件案例)。 因此,病例可以從發病率或死亡率登記處提取,或者直接從醫院或具有有效診斷的其他來源收集。 控件被繪製為 樣品 來自同一人群,無論是來自非病例還是來自整個人群。 另一種選擇是 選擇 患有另一種疾病的患者作為對照,但這些患者必須代表病例所來自的人群。 每種情況可能有一個或多個對照(即參照物)。 抽樣方法不同於隊列研究,隊列研究檢查整個人群。 不用說,病例對照設計在降低成本方面的收益是相當可觀的,但重要的是樣本是 代表 案例來源的整個人群(即“研究基礎”)——否則研究可能存在偏差。
確定病例和對照後,通過問卷調查、訪談或在某些情況下從現有記錄(例如,可以從中推斷出工作經歷的工資單記錄)收集他們的暴露歷史。 這些數據可以從參與者本人那裡獲得,如果他們已經去世,也可以從他們的近親那裡獲得。 為確保對稱回憶,重要的是死亡和活著的病例和參考對象的比例相等,因為近親通常提供的暴露史不如參與者本身詳細。 將病例中的暴露模式信息與對照組中的暴露模式信息進行比較,提供對 比值比 (或),間接措施的 暴露人群中患病的風險 相對於未曝光的。
因為病例對照設計依賴於從患有某種疾病的患者(即病例)以及來自病例起源人群的非患病人群樣本(即對照)中獲得的暴露信息,所以與暴露的聯繫只能調查 一種病. 相比之下,該設計允許同時研究 幾個不同的曝光. 案例參照研究非常適合解決具體的研究問題(例如,“接觸二硫化碳會導致冠心病嗎?”),但它也有助於回答更普遍的問題:“哪些接觸會導致這種疾病?
歐洲提出了接觸有機溶劑是否會導致原發性肝癌的問題(例如)。 原發性肝癌的病例在歐洲是一種相對罕見的疾病,最好從國家癌症登記處收集。 假設三年內發生的所有癌症病例構成病例係列。 然後,該研究的人口基數是對相關歐洲國家的全部人口進行為期三年的跟踪調查。 對照是作為來自同一人群的未患肝癌的人的樣本抽取的。 為方便起見(意味著同一來源可用於對對照進行取樣),與溶劑暴露無關的另一種癌症類型的患者可用作對照。 結腸癌與溶劑接觸沒有已知關係; 因此,這種癌症類型可以包括在對照中。 (使用癌症對照可最大限度地減少回憶偏差,因為病例和對照給出的病史的準確性平均而言是對稱的。但是,如果後來揭示了結腸癌與接觸溶劑之間目前未知的某些聯繫,則這種類型的對照會導致對真正風險的低估——而不是誇大。)
對於每個肝癌病例,繪製了兩個對照以獲得更大的統計功效。 (可以繪製更多的控件,但可用資金可能是一個限制因素。如果資金不受限制,也許多達四個控件將是最佳的。超過四個,收益遞減法則適用。)從數據中獲得適當的許可後通常通過郵寄問卷的方式聯繫保護當局、病例和控制人員或其近親,要求提供詳細的職業歷史,特別強調按時間順序排列的所有雇主、工作部門、工作任務在不同的就業,以及在每個任務各自的就業期限。 這些數據很難從親戚那裡獲得; 然而,具體的化學品或商品名稱通常不會被親屬很好地回憶起來。 調查問卷還應包括有關可能的混雜數據的問題,例如飲酒、接觸含黃曲霉毒素的食物以及乙型和丙型肝炎感染。 為了獲得足夠高的回复率,每隔三周向未回复者發送兩次提醒。 這通常會導致最終響應率超過 70%。 然後由工業衛生學家在不知道受訪者的病例或控制狀態的情況下審查職業史,並將暴露分為高、中、低、無和未知的溶劑暴露。 癌症診斷前的十年暴露被忽略了,因為如果潛伏時間那麼短,引髮劑型致癌物可能是癌症的原因,這在生物學上是不合理的(儘管促進劑,事實上,可以)。 在此階段,還可以區分不同類型的溶劑暴露。 因為已經給出了完整的工作經歷,所以也可以探索其他暴露,儘管最初的研究假設不包括這些。 然後可以計算暴露於任何溶劑、特定溶劑、溶劑混合物、不同類別的暴露強度以及與癌症診斷相關的不同時間窗的比值比。 建議從分析中排除那些接觸未知的人。
可以對病例和對照進行取樣和分析 獨立系列 or 匹配組. 匹配意味著根據某些特徵或屬性為每個案例選擇控件,以形成對(或集合,如果為每個案例選擇多個控件)。 匹配通常基於一個或多個這樣的因素來完成,例如年齡、生命狀況、吸煙史、病例診斷的日曆時間等。 在我們的示例中,病例和對照會根據年齡和生命狀況進行匹配。 (生命狀態很重要,因為患者自己通常比近親提供更準確的暴露史,並且出於有效性原因,對稱性是必不可少的。)今天,建議對匹配進行限制,因為此過程可能會引入負面(效應掩蔽) )混雜。
如果一個控件與一個案例匹配,則該設計稱為 配對設計. 如果研究更多對照的成本不至於令人望而卻步,那麼每個案例中不止一個參考對象會提高 OR 估計值的穩定性,從而使研究規模效率更高。
表 2. 病例對照數據的樣本佈局
曝光分類 |
||
外露 |
未曝光 |
|
機殼 |
c1 |
c0 |
非個案 |
n1 |
n0 |
從該表中,可以計算出病例之間的暴露機率和人群(對照組)之間的暴露機率,並將其除以產生暴露機率比 OR。 對於這些情況,暴露機率是 c1 / c0,對於控件來說,它是 n1 / n0. OR 的估計是:
如果暴露的案例比對照多,則 OR 超過 1,反之亦然。 必須以與 RR 相同的方式為 OR 計算和提供置信區間。
再舉一個例子,一家大公司的職業健康中心為 8,000 名暴露於各種粉塵和其他化學試劑的員工提供服務。 我們對混合粉塵暴露與慢性支氣管炎之間的聯繫感興趣。 該研究包括對該人群進行為期一年的隨訪。 我們將慢性支氣管炎的診斷標准定為“連續兩年晨咳、咳痰三個月”。 在研究開始之前定義“陽性”粉塵暴露的標準。 在一年期間訪問健康中心並滿足這些標準的每位患者都是一個案例,而下一位因非肺部問題尋求醫療建議的患者被定義為對照。 假設在研究期間登記了 100 個病例和 100 個對照。 將 40 個案例和 15 個對照歸類為已暴露於灰塵。 然後
c1 = 40, c0 = 60, n1 = 15,和 n0 = 85。
因此,
在前面的例子中,沒有考慮混雜的可能性,混雜可能由於年齡等變量中病例和對照之間的系統差異而導致OR的失真。 減少這種偏差的一種方法是將控制與年齡或其他可疑因素的病例相匹配。 這導致表 3 中描述的數據佈局。
表 3. 如果一個對照與每個病例匹配,則病例對照數據的佈局
參照物 |
||
機殼 |
曝光 (+) |
接觸 (-) |
曝光 (+) |
f+ + |
f+ - |
接觸 (-) |
f- + |
f- - |
重點分析不一致對:即“案例暴露,控制未暴露” (f+–); 和“案例未曝光,控制曝光” (f–+). 當一對中的兩個成員都暴露或未暴露時,該對將被忽略。 配對研究設計中的 OR 定義為
在一項關於鼻癌與木屑暴露之間關聯的研究中,總共有 164 對病例對照。 只有一對,外殼和控件都暴露了,而在 150 對中,外殼和控件都沒有暴露。 不進一步考慮這些對。 外殼(但不是對照)暴露在 12 對中,而對照(但不是外殼)暴露在一對中。 因此,
由於此區間中不包含單位,因此結果具有統計顯著性——也就是說,鼻癌與木屑暴露之間存在統計顯著相關性。
病例對照研究比隊列研究更有效 疾病很少見; 他們實際上可能提供唯一的選擇。 然而,常見疾病也可以通過這種方法進行研究。 如果 很少曝光, 基於暴露的隊列是首選或唯一可行的流行病學設計。 當然,也可以對常見暴露進行隊列研究。 當暴露和疾病都很常見時,隊列和病例對照設計之間的選擇通常是在考慮有效性的情況下決定的。
由於病例對照研究依賴於回顧性暴露數據,通常基於參與者的回憶,其弱點是暴露信息的不准確和粗糙,導致效應掩蔽通過 非微分 (對稱)暴露狀態的錯誤分類。 此外,有時病例和對照之間的回憶可能不對稱,病例通常被認為記得“更好”(即回憶偏差)。
選擇性回憶會導致效果放大偏差 微分 (不對稱)暴露狀態的錯誤分類。 病例對照研究的優勢在於它們的成本效益和能夠相對快速地提供問題解決方案的能力。 由於抽樣策略,它們允許調查非常大的目標人群(例如,通過國家癌症登記處),從而提高研究的統計能力。 在數據保護立法或缺乏良好的人口和發病率登記阻礙隊列研究執行的國家,以醫院為基礎的病例對照研究可能是進行流行病學研究的唯一實用方法。
隊列中的病例對照抽樣(巢式病例對照研究設計)
隊列研究也可以設計為抽樣而不是完整的隨訪。 這種設計以前被稱為“嵌套”病例對照研究。 隊列中的抽樣方法對隊列資格設置了不同的要求,因為現在比較是在同一隊列中進行的。 因此,這不僅應包括接觸嚴重的工人,還應包括接觸較少甚至未接觸的工人,以便提供 曝光對比 本身內。 在組裝隊列時,重要的是要意識到資格要求的這種差異。 如果首先對符合“大量”暴露條件的隊列進行完整隊列分析,然後再對同一隊列進行“巢式”病例對照研究,則該研究將變得不敏感。 這引入了效應掩蔽,因為由於隊列成員之間的暴露經驗缺乏可變性,暴露對比“按設計”不足。
然而,如果隊列具有廣泛的暴露經驗,那麼嵌套病例對照方法就非常有吸引力。 一個人收集了隊列中在隨訪期間出現的所有病例以形成病例係列,而只有一個 樣品 的非案例是為控制系列繪製的。 然後,與傳統的病例對照設計一樣,研究人員通過採訪病例和對照(或他們的近親),通過仔細檢查雇主的人員名單,通過構建 工作接觸矩陣,或通過組合這些方法中的兩種或多種。 控件可以與案例匹配,也可以將它們視為一個獨立的系列。
與隊列中每個成員的詳盡信息採購相比,抽樣方法的成本更低。 特別是,因為只研究了一個控製樣本,更多的資源可以用於對每個案例和控制進行詳細和準確的暴露評估。 然而,與經典隊列研究中相同的統計功效問題普遍存在。 為了獲得足夠的統計能力,隊列必須始終包含“足夠”數量的暴露病例,具體取決於應檢測到的風險程度。
橫斷面研究設計
從科學意義上講,橫截面設計是研究人群的橫截面,沒有考慮時間。 暴露和發病率(患病率)都是在同一時間點測量的。
從病因學的角度來看,這項研究設計薄弱,部分原因是它處理的是患病率而不是發病率。 患病率是一項綜合指標,取決於疾病的發病率和持續時間。 這也限制了橫斷面研究對持續時間長的疾病的使用。 更嚴重的是,由於依賴於健康從暴露組中排除對暴露影響更敏感的那些人,造成了強烈的負面偏見。 因此,病因問題最好通過縱向設計來解決。 實際上,橫斷面研究無法得出關於暴露是否先於疾病或相反的結論。 僅當暴露與結果之間存在真實時間關係時,橫截面才具有病因學意義,這意味著當前暴露必須具有即時影響。 然而,可以對暴露進行橫截面測量,以便它代表過去較長的時間段(例如,血鉛水平),而結果測量是流行率之一(例如,神經傳導速度)。 因此,該研究是縱向和橫斷面設計的混合體,而不僅僅是研究人群的橫斷面。
橫斷面描述性調查
橫斷面調查通常對實踐和管理而非科學目的有用。 流行病學原理可應用於職業衛生環境中的系統監測活動,例如:
為所有類型的調查選擇具有代表性、有效和具體的發病率指標非常重要。 與臨床診斷相比,一項調查或篩選程序只能使用相當少的測試,因此篩選測試的預測價值很重要。 不敏感的方法無法檢測到感興趣的疾病,而高度敏感的方法會產生太多的假陽性結果。 在職業環境中篩查罕見病是不值得的。 所有病例發現(即篩查)活動還需要一種機制來照顧那些在診斷和治療方面有“陽性”發現的人。 否則只會導致挫敗感,並可能弊大於利。
有效性的需要
流行病學旨在提供對人群疾病經歷的理解。 特別是,它可以用來深入了解健康不佳的職業原因。 這些知識來自對患有疾病的人群進行的研究,通過將他們與沒有這種疾病的人進行比較。 另一種方法是檢查從事特定工作並有特定暴露的人會患上哪些疾病,並將這些疾病模式與沒有類似暴露的人的疾病模式進行比較。 這些研究提供了特定暴露的疾病風險估計。 為了將來自此類研究的信息用於製定預防計劃、識別職業病以及為那些受到暴露影響的工人提供適當補償,這些研究必須是有效的。
合法性 可以定義為一項研究反映真實情況的能力。 因此,一項有效的研究能夠正確衡量暴露與疾病之間的關聯(陽性、陰性或缺失)。 它描述了真實風險的方向和大小。 有效性分為兩種類型:內部有效性和外部有效性。 內部效度是一項研究反映研究對象之間真實情況的能力; 外部有效性反映了人口中可能發生的情況。
有效性與測量的真實性有關。 有效性必須與測量精度區分開來,後者是研究規模和研究設計效率的函數。
內部有效性
當一項研究沒有偏見時,據說它是內部有效的,因此真實反映了研究參與者中存在的暴露與疾病之間的關聯。 觀察到的與暴露相關的疾病風險可能確實來自真實的關聯,因此是有效的,但它也可能反映了偏見的影響。 偏見會給現實帶來扭曲的形象。
三種主要類型的偏見,也稱為 系統誤差,通常區分為:
下面將使用職業健康環境中的示例簡要介紹它們。
選擇偏見
當進入研究受到潛在研究參與者的暴露狀態知識的影響時,就會發生選擇偏倚。 因此,只有當該人進入研究時(之前)疾病已經發生時,才會遇到這個問題。 通常,在流行病學環境中,這將發生在病例對照研究或回顧性隊列研究中。 這意味著,如果已知某人已被暴露,則他或她將更有可能被視為病例。 三組情況可能導致此類事件,這也取決於疾病的嚴重程度。
自我選擇偏差
當知道自己過去曾接觸過已知或認為有害的產品並且確信自己的疾病是接觸的結果的人會諮詢醫生以了解其他未接觸過的人可能忽略的症狀時,就會發生這種情況。 對於幾乎沒有明顯症狀的疾病,這種情況尤其容易發生。 一個例子可能是處理用於癌症治療的藥物的女護士早孕流產或自然流產。 這些女性比大多數女性更了解生殖生理學,並且由於擔心她們生育孩子的能力,可能更有可能識別或標記為自然流產,而其他女性只會將其視為月經延遲。 羅斯曼 (Rothman, 1986) 引用的一項回顧性隊列研究的另一個例子涉及美國疾病控制中心對在內華達州進行的美國原子彈試驗期間在場的士兵進行的白血病研究。 在試驗場上的部隊中,有 76% 被追踪並構成了隊列。 其中,82% 是由調查人員發現的,但另有 18% 的人在聽到有關該研究的宣傳後親自聯繫了調查人員。 CDC 追踪到的 82% 中有 18 例白血病病例,XNUMX% 中有 XNUMX 例是自訴的。 這有力地表明,研究人員識別暴露人員的能力與白血病風險有關。
診斷偏差
當醫生一旦知道患者之前接觸過什麼,就更有可能診斷出特定疾病時,就會發生這種情況。 例如,當大多數油漆是含鉛的時,一種稱為周圍神經炎伴麻痺的周圍神經疾病症狀也被稱為畫家的“腕骨下垂”。 了解患者的職業使得即使在早期階段也更容易診斷疾病,而對於不知道職業暴露於鉛的研究參與者來說,識別病原體會困難得多。
拒絕參與研究導致的偏見
當人們(無論是健康的還是生病的)被要求參加一項研究時,有幾個因素會影響他們是否同意。 是否願意回答冗長的問卷,這些問卷有時會詢問敏感問題,甚至更願意提供血液或其他生物樣本,這可能取決於個人的自利程度。 意識到過去潛在接觸的人可能準備好接受這項調查,希望這有助於找到疾病的原因,而認為自己沒有接觸過任何危險的東西或不感興趣的人在知道的情況下,可以拒絕參加研究的邀請。 這可以導致選擇那些最終將成為研究參與者的人,而不是所有可能已經成為研究參與者的人。
信息偏差
這也稱為觀察偏差,關注隨訪研究中的疾病結果和病例對照研究中的暴露評估。
前瞻性隨訪(隊列)研究中的差異結果評估
在研究開始時定義了兩組:暴露組和未暴露組。 如果這兩組之間的病例搜索不同,就會出現診斷偏差問題。 例如,考慮在給定行業中暴露於二噁英意外釋放的一群人。 對於高暴露人群,建立了積極的隨訪製度,定期進行醫學檢查和生物監測,而其餘的工作人群僅接受常規護理。 在密切監測下的人群中很可能會發現更多疾病,這將導致對風險的潛在高估。
回顧性隊列研究中的差異損失
在回顧性隊列研究中可能會出現與上一段中描述的機制相反的機制。 在這些研究中,通常的處理方法是從過去在特定行業就業的所有人的檔案開始,然後評估就業後的疾病或死亡率。 不幸的是,在幾乎所有的研究中,檔案都是不完整的,而且一個人失踪的事實可能與暴露狀態或疾病狀態或兩者有關。 例如,在最近對接觸芳香胺的化學工業工人進行的一項研究中,在一組 777 名接受過尿路腫瘤細胞學篩查的工人中發現了 34 個腫瘤。 總共只有 4.4 條記錄丟失,相當於暴露評估文件丟失了 25%,但對於膀胱癌病例,XNUMX 例中有 XNUMX 例丟失了暴露數據,即 XNUMX%。 這表明,成為案件的人的檔案比其他工人的檔案更容易丟失。 這可能是由於公司內部更頻繁的工作變動(這可能與曝光效應有關)、辭職、解僱或純屬偶然。
病例對照研究中暴露的差異評估
在病例對照研究中,疾病在研究開始時已經發生,將尋求有關過去暴露的信息。 偏見可能來自採訪者或研究參與者對調查的態度。 信息通常由訓練有素的採訪者收集,他們可能知道也可能不知道研究背後的假設。 例如,在高度工業化地區進行的一項基於人群的膀胱癌病例對照研究中,研究人員可能很清楚某些化學物質(例如芳香胺)是膀胱癌的危險因素。 如果他們還知道誰患了這種疾病,誰沒有患上這種疾病,他們可能會對患有膀胱癌的參與者進行比對對照組更深入的採訪。 他們可能會堅持提供過去職業的更詳細信息,系統地搜索接觸芳香胺的情況,而對於控制,他們可能會以更常規的方式記錄職業。 由此產生的偏差被稱為 暴露懷疑偏差.
參與者自己也可能對這種偏見負責。 這就是所謂的 回憶偏差 以區別於面試官的偏見。 兩者都有曝光懷疑作為偏見的機制。 生病的人可能會懷疑他們的疾病是由職業引起的,因此會盡可能準確地記住他們可能接觸過的所有危險因素。 在處理未定義產品的情況下,他們可能傾向於回憶精確化學品的名稱,尤其是在向他們提供可疑產品清單的情況下。 相比之下,控件可能不太可能經歷相同的思維過程。
混淆
當在暴露和疾病之間觀察到的關聯部分是研究中暴露的影響與另一個因素混合的結果時,就會存在混雜。 比方說,我們發現焊工患肺癌的風險增加了。 我們很想立即得出結論,接觸焊接煙霧與肺癌之間存在因果關係。 然而,我們也知道吸煙是迄今為止肺癌的主要危險因素。 因此,如果有可用信息,我們將開始檢查焊工和其他研究參與者的吸煙狀況。 我們可能會發現焊工比非焊工更容易吸煙。 在這種情況下,已知吸煙與肺癌有關,同時,在我們的研究中,吸煙也被發現與焊工有關。 用流行病學術語來說,這意味著吸煙與肺癌和焊接有關,正在混淆焊接與肺癌之間的關聯。
交互或效果修改
與上面列出的所有問題,即選擇、信息和混雜這些偏差相比,交互作用不是由於研究設計或分析問題而導致的偏差,而是反映了現實及其複雜性。 這種現象的一個例子如下:接觸氡是肺癌的危險因素,吸煙也是如此。 此外,吸煙和氡暴露對肺癌風險的影響也不同,這取決於它們是共同作用還是單獨作用。 大多數關於這個主題的職業研究都是在地下礦工中進行的,有時會提供相互矛盾的結果。 總的來說,似乎存在支持吸煙和氡暴露相互作用導致肺癌的論點。 這意味著肺癌風險會因接觸氡而增加,即使在非吸煙者中也是如此,但吸煙者因氡而增加的風險比非吸煙者大得多。 在流行病學術語中,我們說效果是乘法的。 與上述混雜相反,相互作用需要在分析中仔細分析和描述,而不是簡單地控制,因為它反映了生物學水平上發生的事情,而不僅僅是糟糕的研究設計的結果。 它的解釋導致對研究結果的更有效解釋。
外部有效性
只有確保內部有效性得到保障後,才能解決此問題。 如果我們確信研究中觀察到的結果反映了真實的關聯,我們可以問自己是否可以將這些結果外推到研究參與者本身所在的更大人群,甚至是其他相同的人群或者至少非常相似。 最常見的問題是針對男性獲得的結果是否也適用於女性。 多年來,研究,特別是職業流行病學調查一直只在男性中進行。 1960 年代和 1970 年代在美國、英國和瑞典對化學家進行的研究都發現特定癌症(即白血病、淋巴瘤和胰腺癌)的風險增加。 根據我們對接觸溶劑和其他一些化學物質的影響的了解,我們當時已經可以推斷出實驗室工作也對女性有致癌風險。 事實上,當第一項針對女性化學家的研究最終於 1980 世紀 XNUMX 年代中期發表時,情況就是如此,該研究發現的結果與男性相似。 值得注意的是,發現的其他多發癌症是乳腺癌和卵巢癌,傳統上認為它們僅與內源性因素或生殖有關,但最近懷疑殺蟲劑等環境因素可能對其起作用。 在女性癌症的職業決定因素方面需要做更多的工作。
有效研究的策略
永遠不會存在完全有效的研究,但研究人員有責任盡量避免或至少盡量減少偏差。 這通常最好在研究設計階段完成,但也可以在分析期間進行。
學習規劃
只有通過仔細設計流行病學研究和嚴格執行所有後續的日常指導方針,包括對現場條件下研究的質量保證的一絲不苟的關注,才能避免選擇和信息偏差。 混淆可以在設計或分析階段處理。
選擇
必須明確定義將參與者視為案例的標準。 人們不能或至少不應該嘗試研究定義不明確的臨床狀況。 將暴露知識可能對疾病評估產生的影響降至最低的一種方法是只包括那些無論患者病史的任何信息都會被診斷出來的嚴重病例。 在癌症領域,研究通常僅限於具有疾病組織學證據的病例,以避免納入臨界病變。 這也意味著被研究的群體是明確定義的。 例如,在癌症流行病學中眾所周知,給定器官內不同組織學類型的癌症可能具有不同的風險因素。 如果病例數足夠,最好將肺腺癌與肺鱗癌區分開來。 無論進入研究的最終標準是什麼,都應該明確定義和描述。 例如,應使用國際疾病分類 (ICD) 指明疾病的確切代碼,對於癌症,應使用國際疾病分類-腫瘤學 (ICD-O)。
一旦指定了標準,就應努力最大限度地參與研究。 拒絕參與的決定幾乎從來都不是隨機做出的,因此會導致偏見。 研究應該首先呈現給看病的臨床醫生。 需要他們的批准才能接近患者,因此必須說服他們支持這項研究。 一個經常具有說服力的論點是,這項研究符合公眾健康的利益。 然而,在這個階段最好不要討論正在評估的確切假設,以避免對相關臨床醫生產生不當影響。 不應要求醫師承擔補充職責; 如果研究調查者提供手段來執行研究所需的常規護理之外的任何額外任務,則更容易說服衛生人員支持研究。 採訪者和數據提取者不應該了解他們患者的疾病狀況。
對提供給參與者的信息也應給予類似的關注。 研究的目標必須以寬泛、中立的方式描述,但也必須具有說服力和說服力。 重要的是,在避免使用醫學術語的同時,充分理解公共衛生的保密性和利益問題。 在大多數情況下,使用財務或其他激勵措施被認為是不合適的,儘管應為參與者可能產生的任何費用提供補償。 最後但並非最不重要的一點是,普通民眾應該具備足夠的科學素養,以了解此類研究的重要性。 必須向每個潛在參與者解釋參與的好處和風險,他們需要完成調查問捲和/或提供生物樣本進行存儲和/或分析。 在獲得事先和充分知情的同意時不應施加脅迫。 如果研究完全基於記錄,則必須獲得負責確保此類記錄機密性的機構的事先批准。 在這些情況下,通常可以放棄個人參與者的同意。 相反,工會和政府官員的批准就足夠了。 流行病學調查不會對個人的私生活構成威脅,而是對改善人群健康的潛在幫助。 在進行研究之前,需要機構審查委員會(或倫理審查委員會)的批准,並且他們期望上述大部分內容供他們審查。
資訊
在前瞻性後續研究中,暴露和未暴露參與者的疾病或死亡率狀態評估方法必須相同。 特別是,不應使用不同的來源,例如只檢查非暴露參與者的中央死亡登記冊,以及對暴露參與者使用強化主動監測。 同樣,必須以嚴格可比的方式獲得死因。 這意味著,如果一個系統被用來為未暴露的人群(通常是普通人群)獲取官方文件,那麼就永遠不應該計劃通過醫療記錄或對參與者本人或其家人的訪談來獲得更精確的信息。暴露的子組。
在回顧性隊列研究中,應努力確定研究人群與感興趣人群的比較接近程度。 人們應該通過使用有關人口構成的各種來源來提防暴露組和非暴露組的潛在差異損失。 例如,將工資單列表與工會會員列表或其他專業列表進行比較可能很有用。 必須協調差異,必須嚴格遵守研究採用的方案。
在病例對照研究中,存在其他選擇以避免偏倚。 採訪者、研究人員和研究參與者無需了解研究中的確切假設。 如果他們不知道正在測試的關聯,他們就不太可能嘗試提供預期的答案。 讓研究人員對研究假設一無所知實際上通常是非常不切實際的。 採訪者幾乎總是知道最有可能引起興趣的暴露,以及誰是個案,誰是對照。 因此,我們必須依靠他們的誠實以及他們在基礎研究方法方面的訓練,這應該是他們專業背景的一部分; 客觀性是科學各個階段的標誌。
不告知研究參與者研究的確切對象更容易。 關於收集數據以更好地了解健康和疾病的必要性的良好、基本的解釋通常就足夠了,並且將滿足倫理審查的需要。
混淆
混雜是唯一可以在研究設計階段或在提供足夠信息的情況下在分析階段處理的偏倚。 例如,如果年齡被認為是興趣關聯的潛在混雜因素,因為年齡與疾病風險相關(即,癌症在老年人中變得更頻繁)並且還與暴露(暴露條件隨年齡或與年齡相關的因素,如資格、工作職位和就業期限),存在幾種解決方案。 最簡單的方法是將研究限制在指定的年齡範圍內——例如,只招募 40 至 50 歲的白人男性。這將為簡單分析提供要素,但也有將結果的應用限制在單一人群的缺點性別年齡/種族群體。 另一種解決方案是按年齡匹配。 這意味著對於每個案例,都需要一個相同年齡的參照物。 這是一個很有吸引力的想法,但必須記住,隨著匹配因素數量的增加,滿足這一要求可能會很困難。 此外,一旦匹配了一個因素,就無法評估其在疾病發生中的作用。 最後一個解決方案是在研究數據庫中獲得關於潛在混雜因素的足夠信息,以便在分析中檢查它們。 這可以通過簡單的分層分析或使用更複雜的工具(例如多變量分析)來完成。 但是,應該記住,分析永遠無法彌補設計或實施不當的研究。
結論
流行病學研究中出現偏差的可能性由來已久。 當所研究的關聯很強(如吸煙和肺癌的情況)時,這並不是一個太大的問題,因此一些不准確不會導致太嚴重的問題。 然而,現在是評估較弱風險因素的時候了,對更好工具的需求變得至關重要。 這包括對優秀研究設計的需求,以及將各種傳統設計(如病例對照或隊列研究)的優勢與更創新的方法(如嵌套在隊列中的病例對照研究)相結合的可能性。 此外,生物標誌物的使用可以提供對當前和可能過去的暴露以及疾病早期階段進行更準確評估的方法。
暴露測量中的誤差可能會對所研究的暴露-疾病關係產生不同的影響,這取決於誤差的分佈方式。 如果流行病學研究是盲目進行的(即,在不了解研究參與者的疾病或健康狀況的情況下進行測量),我們預計測量誤差將均勻分佈在疾病或健康狀況的各個層面。
表 1 提供了一個示例:假設我們招募了一群在工作中接觸有毒物質的人,以調查一種常見疾病。 我們僅在招募時確定暴露狀態(T0), 而不是在後續的任何進一步時間點。 然而,假設許多人確實在下一年改變了他們的暴露狀態:在時間 T1,原來250名接觸者中有1,200人停止接觸,而原來150名未接觸者中有750人開始接觸毒物。 因此,在時間 T1, 1,100 人暴露,850 人未暴露。 因此,根據我們在時間 T 對暴露狀態的初始測量,我們對暴露進行了“錯誤分類”0. 然後在 20 年後(在時間 T2) 並評估疾病的累積風險。 (示例中的假設是只有超過一年的風險才是一個問題。)
表 1. 在時間 T 招募的 1950 人(在工作中暴露和未暴露)的假設隊列0 並且在時間 T 確定其疾病狀態2
Time |
|||
T0 |
T1 |
T2 |
暴露工人 1200 250 退出暴露 1100 (1200-250+150)
時間 T 的病例數2 = 220 暴露在外的工人
非接觸工人 750 150 開始接觸 850 (750-150+250)
時間 T 的病例數2 = 85 在未接觸的工人中
真正的風險 時間 T 的疾病2 在暴露的工人中為 20% (220/1100),
未接觸的工人 (10/85) 為 850%(風險比 = 2.0)。
預估風險 在 T2 被歸類為暴露於 T 的人群中的疾病0:20%
(即暴露者的真實風險)´ 950(即 1200-250)+ 10%
(即未暴露的真實風險)´ 250 = (190+25)/1200 = 17.9%
預估風險 在 T2 被歸類為非暴露的人群中的疾病
T0: 20%(即暴露者的真實風險)´ 150 +10%
(即未暴露的真實風險)´ 600(即 750-150)= (30+60)/750 = 12%
估計風險比率 = 17.9% / 12% = 1.49
在這個例子中,錯誤分類取決於研究設計和人群特徵,而不是暴露測量的技術限制。 錯誤分類的影響是暴露人群和未暴露人群的累積風險之間的“真實”比率 2.0 變為“觀察到”比率 1.49(表 1)。 這種對風險比率的低估源於暴露與疾病之間關係的“模糊”,這種情況發生在暴露的錯誤分類(如本例)根據疾病或健康狀況均勻分佈時(即,暴露測量是不受此人是否患有我們正在研究的疾病的影響)。
相比之下,當暴露錯誤分類未均勻分佈在感興趣的結果中時,可能會低估或高估感興趣的關聯。 在示例中,我們可能有 偏見, 如果暴露分類取決於工人的疾病或健康狀況,不僅會模糊病因學關係。 例如,如果我們決定從一組暴露的工人和一組未暴露的工人那裡收集生物樣本,以便識別與工作暴露相關的早期變化,就可能會出現這種情況。 與未暴露的工人樣本相比,暴露工人的樣本可能會以更準確的方式進行分析; 科學好奇心可能會促使研究人員測量暴露人群中的其他生物標誌物(包括淋巴細胞中的 DNA 加合物或 DNA 氧化損傷的尿液標誌物),假設這些人在科學上“更有趣”。 這是一種相當普遍的態度,但可能會導致嚴重的偏見。
關於統計數據在因果關係的流行病學研究中的作用存在很多爭論。 在流行病學中,統計學主要是用於評估基於人類(以及動物)種群的數據的方法的集合。 特別是,統計學是一種對不確定現象進行量化和測量的技術。 所有處理現實的非確定性、可變方面的科學研究都可以從統計方法中受益。 在流行病學中,可變性是觀察單位所固有的——一個人不是一個確定性的實體。 雖然實驗設計會在更好地滿足隨機變化方面的統計假設方面得到改進,但出於倫理和實際原因,這種方法並不常見。 相反,流行病學從事的是觀察性研究,這些研究與隨機性和其他變異性來源相關聯。
統計理論關注如何控制數據中的非結構化可變性,以便從經驗觀察中做出有效的推論。 由於缺乏對所研究現象的可變行為的任何解釋,統計假設它是 隨機——也就是說,與某些平均自然狀態的非系統性偏差(參見 Greenland 1990 對這些假設的批評)。
科學依賴於經驗 證據 以證明其自然事件的理論模型是否有效。 事實上,統計理論中使用的方法決定了現實世界中的觀察與科學家以數學模型形式對現象的看法的符合程度。 因此,必須謹慎選擇基於數學的統計方法; 有很多關於“如何用統計數字說謊”的例子。 因此,流行病學家應該意識到他們用於衡量疾病風險的技術的適當性。 特別是,在解釋具有統計顯著性和非統計顯著性的結果時需要格外小心。
這個詞的第一個意思 統計 與根據一組值計算的任何匯總數量相關。 算術平均數、中位數或眾數等描述性指標或統計量被廣泛用於總結一系列觀察中的信息。 歷史上,這些摘要描述符被各州用於行政目的,因此被命名為 統計. 在流行病學中,常見的統計數據源自流行病學本質的比較,它提出的問題包括:“一個人群是否比另一個人群更容易患病?” 在進行此類比較時,相對風險是衡量個體特徵與患病概率之間關聯強度的常用指標,最常用於病原學研究; 歸因風險也是衡量個體特徵與疾病發生之間關聯的指標,但它強調的是通過消除相關因素的干預措施所避免的病例數的增加——它主要應用於公共衛生和預防醫學。
這個詞的第二個意思 統計 涉及技術的收集和統計推斷的基礎理論。 這是歸納邏輯的一種特殊形式,它指定了從一組特定的經驗觀察中獲得有效概括的規則。 如果滿足某些假設,這種概括將是有效的。 這是未經教育地使用統計數據欺騙我們的第二種方式:在觀察流行病學中,很難確定統計技術所隱含的假設。 因此,敏感性分析和穩健估計應該是任何正確進行的數據分析的伴侶。 最終結論也應基於整體知識,而不應完全依賴統計假設檢驗的結果。
定義
A 統計單位 是進行經驗觀察的元素。 它可以是一個人、一個生物標本或一塊待分析的原材料。 通常統計單位由研究人員獨立選擇,但有時可以設置更複雜的設計。 例如,在縱向研究中,隨著時間的推移對一組人進行一系列確定; 本研究中的統計單位是一組決定,它們不是獨立的,而是根據它們與被研究的每個人的各自聯繫構成的。 統計單位之間缺乏獨立性或相關性,在統計分析中值得特別注意。
A 變量 是在給定統計單位上測量的個體特徵。 它應該與 不變,固定的個體特徵——例如,在對人類的研究中,頭部或胸部是常數,而研究中單個成員的性別是變量。
使用不同的方法評估變量 測量尺度. 第一個區別是定性和定量尺度。 定性變量提供不同的 形式 or 類別. 如果每種模態不能相對於其他模態進行排序或排序——例如,頭髮顏色或性別模態——我們將變量表示為 公稱. 如果類別可以排序——比如疾病的嚴重程度——變量稱為 序數. 當一個變量由一個數值組成時,我們說這個尺度是定量的。 一種 離散的 scale 表示變量只能取一些確定的值——例如,疾病病例數的整數值。 一種 連續 尺度用於那些導致 實 數字。 據說連續尺度是 間隔 當 null 值具有純粹的約定意義時縮放。 也就是說,零值並不意味著零數量——例如,零攝氏度的溫度並不意味著零熱能。 在這種情況下,只有值之間的差異才有意義(這就是術語“間隔”尺度的原因)。 一個真正的空值表示 比 規模。 對於在該尺度上測量的變量,值的比率也是有意義的:事實上,兩倍的比率意味著兩倍的數量。 例如,說一個物體的溫度是第二個物體的兩倍意味著它的熱能是第二個物體的兩倍, 前提是 溫度是按比例測量的(例如,以開爾文度為單位)。 給定變量的一組允許值稱為變量的域。
統計範式
統計學處理從一組特定觀察結果中概括的方法。 這組經驗測量稱為 樣品. 我們從樣本中計算出一些描述性統計數據,以總結收集到的信息。
為了表徵一組測量通常需要的基本信息與其集中趨勢和可變性有關。 在幾個備選方案之間的選擇取決於用於測量現象的尺度以及計算統計數據的目的。 在表 1 中,描述了集中趨勢和變異性(或離散度)的不同度量,並與適當的度量尺度相關聯。
表 1. 按測量尺度劃分的集中趨勢和分散指數
測量尺度 |
||||
定性 |
量 |
|||
指數 |
定義 |
公稱 |
序數 |
區間/比率 |
算術平均值 |
觀察值總和除以觀察總數 |
|
|
x |
中位數 |
觀察到的分佈的中點值 |
|
x |
x |
模式 |
最常見的值 |
x |
x |
x |
範圍 |
分佈的最低和最高值 |
|
x |
x |
方差 |
每個值與平均值的平方差之和除以觀察總數減 1 |
|
|
x |
計算的描述性統計量稱為 估計 當我們用它們來代替從中選擇樣本的人口的類似數量時。 估計的人口對應物是常量,稱為 參數. 可以使用不同的統計方法獲得相同參數的估計值。 估計應該既有效又精確。
總體樣本範式意味著可以通過從總體中選擇樣本的方式來確保有效性。 隨機或概率抽樣是通常的策略:如果總體中的每個成員被包含在樣本中的概率相同,那麼平均而言,我們的樣本應該代表總體,而且,任何與我們期望的偏差都可能是偶然解釋的。 如果已經執行了隨機抽樣,也可以計算出與我們預期的給定偏差的概率。 同樣的推理適用於為我們的樣本計算的關於總體參數的估計值。 例如,我們將樣本的算術平均值作為總體平均值的估計值。 樣本平均值和總體平均值之間的任何差異(如果存在)都歸因於樣本中成員的選擇過程中的隨機波動。 如果樣本是隨機選擇的,我們可以計算出這種差異的任何值的概率。 如果樣本估計值與總體參數之間的偏差不能由偶然原因解釋,則稱該估計值是 偏. 觀察或實驗的設計為估計提供了有效性,基本的統計範式是隨機抽樣。
在醫學中,當不同群體之間的比較是研究的目的時,採用第二種範式。 一個典型的例子是對照臨床試驗:根據預先定義的標準選擇一組具有相似特徵的患者。 在這個階段不關心代表性。 每位參加試驗的患者都通過隨機程序分配到治療組(接受標準療法和待評估的新藥)或對照組(接受標準療法和安慰劑)。 在此設計中,將患者隨機分配到每個組取代了樣本成員的隨機選擇。 兩組之間差異的估計可以統計評估,因為在新藥無效的假設下,我們可以計算任何非零差異的概率。
在流行病學中,我們缺乏隨機組合暴露人群和非暴露人群的可能性。 在這種情況下,我們仍然可以使用統計方法,就好像分析的組是隨機選擇或分配的一樣。 這一假設的正確性主要取決於研究設計。 這一點特別重要,它強調了流行病學研究設計相對於生物醫學研究中統計技術的重要性。
信號與噪聲
術語 隨機變量 指的是一個變量,其定義的概率與它可以假設的每個值相關聯。 隨機變量概率分佈的理論模型是總體模型。 樣本對應物由樣本頻率分佈表示。 這是報告一組數據的有用方法; 它由一個笛卡爾平面組成,橫軸是感興趣的變量,縱軸是頻率或相對頻率。 圖形顯示使我們能夠很容易地看到什麼是最頻繁的值,以及分佈如何集中在某些中心值(如算術平均值)周圍。
對於隨機變量及其概率分佈,我們使用術語 參數, 平均期望值 (而不是算術平均值)和 方差. 這些理論模型描述了給定現象的可變性。 在信息論中,信號用集中趨勢(例如均值)來表示,而噪聲則用分散指數(例如方差)來衡量。
為了說明統計推斷,我們將使用二項式模型。 在接下來的部分中,將介紹點估計和置信區間的概念、假設檢驗和錯誤決策的概率以及研究的功效。
表 2. 二項式實驗的可能結果(是 = 1,否 = 0)及其概率(n = 3)
工作者 |
機率 |
||
A |
B |
C |
|
0 |
0 |
0 |
|
1 |
0 |
0 |
|
0 |
1 |
0 |
|
0 |
0 |
1 |
|
0 |
1 |
1 |
|
1 |
0 |
1 |
|
1 |
1 |
0 |
|
1 |
1 |
1 |
一個例子:二項分佈
在生物醫學研究和流行病學中,最重要的隨機變異模型是二項分佈。 它依賴於這樣一個事實,即大多數現象表現為只有兩個類別的名義變量:例如,疾病的存在/不存在:活著/死亡,或康復/生病。 在這種情況下,我們感興趣的是成功的可能性——即感興趣的事件(例如,存在疾病、活著或康復)——以及可以改變它的因素或變量。 讓我們考慮一下 n = 3 名工人,假設我們對有視力障礙(是/否)的概率 p 感興趣。 我們觀察的結果可能是表 2 中的可能結果。
表 3. 二項式實驗的可能結果(是 = 1,否 = 0)及其概率(n = 3)
成功次數 |
機率 |
0 |
|
1 |
|
2 |
|
3 |
任何這些事件組合的概率很容易通過考慮 p 來獲得,p 是(個體)成功概率,對每個受試者都是常數並且獨立於其他結果。 由於我們感興趣的是成功的總數而不是特定的有序序列,我們可以按如下方式重新排列表格(見表 3),並且通常表示 x 成功 P(x) 如:
哪裡 x 是成功的次數和符號 x! 表示的階乘 x,即 x! = x×(x–1)×(x–2)…×1。
當我們考慮事件“生病/未生病”時,個體概率, 指假定主體的狀態; 在流行病學中,這種概率被稱為“患病率”。 為了估計 p,我們使用樣本比例:
p = x/n
有差異:
在一個假設的無限系列的相同大小的複製樣本中 n,我們會得到不同的樣本比例 p = x/n, 概率由二項式公式給出。 的“真實”價值 由每個樣本比例估計,並且 p 的置信區間,即 p 的一組可能值,給定觀察數據和預定義的置信水平(比如 95%),從二項分佈估計為p 的一組值,它給出的概率是 x 大於預先指定的值(比如 2.5%)。 對於我們觀察到的假設實驗 x = 15 次成功 n = 30 次試驗,估計成功的概率為:
表 4. 二項分佈。 不同值的概率 在 n = 15 次試驗中 x = 30 次成功
機率 |
|
0.200 |
0.0002 |
0.300 |
0.0116 |
0.334 |
0.025 |
0.400 |
0.078 |
0.500 |
0.144 |
0.600 |
0.078 |
0.666 |
0.025 |
0.700 |
0.0116 |
從表 95 中獲得的 p 的 4% 置信區間為 0.334 – 0.666。 表中的每個條目顯示的概率 x = 15 次成功 n = 30 次試驗,用二項式公式計算; 例如,對於 = 0.30,我們從:
適用於 n 大和 p 接近 0.5 我們可以使用基於高斯分佈的近似值:
哪裡 za /2 表示概率的標準高斯分佈的值
P (|z| ³ za /2) = a/2;
1 – a 是選定的置信水平。 對於所考慮的例子, = 15/30 = 0.5; n = 30 並且來自標準高斯表 z0.025 = 1.96。 95% 的置信區間導致值集 0.321 – 0.679,通過代入獲得 p = 0.5, n = 30,和 z0.025 = 1.96 代入上述高斯分佈方程。 請注意,這些值接近於之前計算的精確值。
假設的統計檢驗包括關於人口參數值的決策程序。 假設,在前面的例子中,我們想要解決一個命題,即給定工廠的工人視力受損的風險較高。 我們的經驗觀察要檢驗的科學假設是“特定工廠的工人視力受損的風險增加”。 統計學家通過偽造補充假設“視力障礙風險沒有升高”來證明這些假設。 這遵循數學證明 荒謬的 並且,經驗證據不用於驗證斷言,而僅用於證偽斷言。 統計假設稱為 零假設. 第二步涉及為用於對觀察中的可變性建模的概率分佈的參數指定一個值。 在我們的示例中,由於現像是二元的(即存在/不存在視覺障礙),我們選擇參數為 p 的二項分佈,即視覺障礙的概率。 零假設斷言 = 0.25,比方說。 該值是從有關該主題的知識集合和非暴露(即非工人)人群中視力障礙通常流行的先驗知識中選擇的。 假設我們的數據產生了一個估計 = 0.50,來自被檢查的 30 名工人。
我們可以拒絕原假設嗎?
如果是,贊成什麼 替代 假設?
如果證據表明原假設被拒絕,我們將指定一個替代假設作為候選假設。 非定向(雙側)備擇假設聲明總體參數與零假設中聲明的值不同; 方向性(單向)備擇假設聲明總體參數大於(或小於)空值。
表 5. 二項分佈。 成功概率 = 0.25 英寸 n = 30 次試驗
X |
機率 |
累積概率 |
0 |
0.0002 |
0.0002 |
1 |
0.0018 |
0.0020 |
2 |
0.0086 |
0.0106 |
3 |
0.0269 |
0.0374 |
4 |
0.0604 |
0.0979 |
5 |
0.1047 |
0.2026 |
6 |
0.1455 |
0.3481 |
7 |
0.1662 |
0.5143 |
8 |
0.1593 |
0.6736 |
9 |
0.1298 |
0.8034 |
10 |
0.0909 |
0.8943 |
11 |
0.0551 |
0.9493 |
12 |
0.0291 |
0.9784 |
13 |
0.0134 |
0.9918 |
14 |
0.0054 |
0.9973 |
15 |
0.0019 |
0.9992 |
16 |
0.0006 |
0.9998 |
17 |
0.0002 |
1.0000 |
. |
. |
. |
30 |
0.0000 |
1.0000 |
在原假設下,我們可以計算出示例結果的概率分佈。 表 5 顯示,對於 = 0.25和 n = 30,概率(見等式(1))和累積概率:
從這張表中,我們得到了擁有的概率 x ³15 名有視力障礙的工人
P(x ³15) = 1 -P(X15) = 1 - 0.9992 = 0.0008
這意味著,如果他們經歷了非暴露人群的疾病流行,我們極不可能觀察到 15 名或更多有視力障礙的工人。 因此,我們可以拒絕原假設並確認所研究的工人人群中視力障礙的患病率更高。
當 n×p³ 5 和 n×(1-) ³ 5,我們可以使用高斯近似:
從標準高斯分佈表中我們得到:
P(|z|>2.95) = 0.0008
與確切的結果非常吻合。 從這個近似我們可以看出,假設的統計檢驗的基本結構由信噪比組成。 在我們的例子中,信號是(p - ), 觀察到的與零假設的偏差,而噪聲是標準偏差 P:
比值越大,空值概率越小.
在做出有關統計假設的決策時,我們可能會犯兩種錯誤:I 類錯誤,當原假設為真時拒絕原假設; 或 II 型錯誤,當原假設為假時接受原假設。 概率水平,或 p值, 是 I 類錯誤的概率,用希臘字母 a 表示。 這是根據原假設下觀測值的概率分佈計算得出的。 通常預先定義一個錯誤水平(例如,5%、1%),並在我們的觀察結果的概率等於或小於這個所謂的臨界水平時拒絕零假設。
II 類錯誤的概率用希臘字母 β 表示。 要計算它,我們需要在備擇假設中指定要測試的參數的 α 值(在我們的示例中,α 值用於 ). 通用備選假設(不同於、大於、小於)沒有用。 在實踐中,一組備擇假設的 β 值或其補充值是有意義的,這稱為檢驗的統計功效。 例如,將 α-error 值固定為 5%,從表 5 中我們發現:
P(x ³12) <0.05
在原假設下 = 0.25。 如果我們至少要觀察 x = 12 次成功,我們將拒絕原假設。 相應的 β 值和冪為 x = 12 由表 6 給出。
表 6. x = 12、n = 30、α = 0.05 的 II 類誤差和功效
β |
電力 |
|
0.30 |
0.9155 |
0.0845 |
0.35 |
0.7802 |
0.2198 |
0.40 |
0.5785 |
0.4215 |
0.45 |
0.3592 |
0.6408 |
0.50 |
0.1808 |
0.8192 |
0.55 |
0.0714 |
0.9286 |
在這種情況下,我們的數據無法區分是否 大於零值 0.25 但小於 0.50,因為對於這些值,研究的功效太低 (<80%) <0.50——也就是說,我們研究的靈敏度是 8% = 0.3, 22% 對於 = 0.35,..., 64% 對於 = 0.45。
實現較低 β 值或較高功效水平的唯一方法是增加研究規模。 例如,在表 7 中,我們報告了 β 和功效 n = 40; 正如預期的那樣,我們應該能夠檢測到 值大於 0.40。
表 7. x = 12、n = 40、α = 0.05 的 II 類誤差和功效
β |
電力 |
|
0.30 |
0.5772 |
0.4228 |
0.35 |
0.3143 |
0.6857 |
0.40 |
0.1285 |
0.8715 |
0.45 |
0.0386 |
0.8614 |
0.50 |
0.0083 |
0.9917 |
0.55 |
0.0012 |
0.9988 |
研究設計基於對一組備選假設的仔細審查,這些備選假設值得考慮並保證提供足夠樣本量的研究的功效。
在流行病學文獻中,強調了提供可靠風險估計的相關性。 因此,報告置信區間(95% 或 90%)比報告更重要 p-假設檢驗的值。 按照同樣的推理,應該注意對小規模研究結果的解釋:由於低功效,即使是中間效應也可能無法檢測到,另一方面,隨後可能無法複製巨大的效應。
高級方法
在過去幾年中,職業醫學背景下使用的統計方法的複雜程度一直在增加。 在統計建模領域可以找到重大發展。 Nelder 和 Wedderburn 系列的非高斯模型(廣義線性模型)一直是對職業流行病學等領域知識增長最顯著的貢獻之一,相關響應變量是二元的(例如,生存/死亡)或計數(例如,工業事故的數量)。
這是廣泛應用回歸模型作為基於列聯表(簡單和分層分析)的更傳統分析類型的替代方案的起點。 泊松、考克斯和邏輯回歸現在通常分別用於縱向和病例對照研究的分析。 這些模型是分類響應變量線性回歸的對應物,具有直接提供相關流行病學關聯度量的優雅特徵。 例如,泊松回歸的係數是比率的對數,而邏輯回歸的係數是優勢比的對數。
以此為基準,統計建模領域的進一步發展主要有兩個方向:重複分類測量的模型和擴展廣義線性模型(廣義加性模型)的模型。 在這兩種情況下,目標都集中在提高統計工具的靈活性,以應對現實中出現的更複雜的問題。 許多職業研究都需要重複測量模型,其中分析單位處於亞個體水平。 例如:
在貝葉斯統計的背景下,已經看到了平行的並且可能更快的發展。 在引入計算機密集型方法後,使用貝葉斯方法的實際障礙消失了。 Monte Carlo 程序,例如 Gibbs 抽樣方案,使我們無需進行數值積分來計算代表貝葉斯方法最具挑戰性的特徵的後驗分佈。 貝葉斯模型在實際和復雜問題中的應用數量在應用期刊中發現了越來越多的空間。 例如,小區域級別的地理分析和生態相關性以及艾滋病預測模型越來越多地使用貝葉斯方法來處理。 這些發展受到歡迎,因為它們不僅代表了可用於流行病學數據分析的替代統計解決方案數量的增加,而且還因為貝葉斯方法可以被認為是一種更合理的策略。
本章前面的文章表明需要仔細評估研究設計,以便從流行病學觀察中得出可靠的推論。 儘管有人聲稱由於該學科的非實驗性質,觀察流行病學的推論很薄弱,但隨機對照試驗或其他類型的實驗設計並不比精心計劃的觀察具有內在的優勢(Cornfield 1954)。 然而,要得出可靠的推論,就需要對研究設計進行徹底的分析,以確定潛在的偏倚和混雜因素。 假陽性和假陰性結果都可能源於不同類型的偏見。
在這篇文章中,討論了一些被提議用於評估流行病學觀察的因果性質的指南。 此外,雖然良好的科學是倫理上正確的流行病學研究的前提,但還有其他與倫理問題相關的問題。 因此,我們專門討論了分析流行病學研究中可能出現的倫理問題。
因果關係評估
幾位作者討論了流行病學中的因果關係評估(Hill 1965;Buck 1975;Ahlbom 1984;Maclure 1985;Miettinen 1985;Rothman 1986;Weed 1986;Schlesselman 1987;Maclure 1988;Weed 1988;Karhausen 1995)。 討論的要點之一是流行病學是否使用或應該使用與其他科學中使用的相同標準來確定因果關係。
原因不應與機制相混淆。 例如,石棉是間皮瘤的病因,而致癌基因突變是一種推定的機制。 根據現有證據,很可能 (a) 不同的外部暴露可以在相同的機制階段起作用,並且 (b) 通常在疾病發展過程中沒有固定和必要的機制步驟順序。 例如,致癌作用被解釋為一系列隨機(概率)轉變,從基因突變到細胞增殖再到基因突變,最終導致癌症。 此外,致癌是一個多因素過程——也就是說,不同的外部暴露都會對其產生影響,而對於易感人群來說,這些都不是必需的。 該模型可能適用於癌症以外的多種疾病。
大多數暴露-疾病關係的這種多因素和概率性質意味著,解開一種特定暴露所扮演的角色是有問題的。 此外,流行病學的觀察性質使我們無法進行可以通過故意改變事件過程來闡明病因學關係的實驗。 觀察到暴露與疾病之間的統計關聯並不意味著該關聯是因果關係。 例如,大多數流行病學家將暴露於柴油機尾氣和膀胱癌之間的關聯解釋為因果關係,但其他人則聲稱,與未暴露於柴油機尾氣的人相比,暴露於柴油機尾氣的工人(主要是卡車和出租車司機)更經常吸煙. 根據這一說法,觀察到的關聯因此會被吸煙等眾所周知的風險因素“混淆”。
鑑於大多數暴露與疾病關聯的概率多因素性質,流行病學家製定了指南來識別可能存在因果關係的關係。 這些是 Bradford Hill 爵士最初針對慢性病提出的指南(1965 年):
這些標準應僅被視為一般準則或實用工具; 事實上,科學的因果評估是一個以測量暴露與疾病關係為中心的迭代過程。 然而,Hill 的標準經常被用作流行病學中因果推理過程的簡明和實用的描述。
讓我們考慮應用 Hill 標準的氯乙烯暴露與肝血管肉瘤之間關係的示例。
流行病學研究結果的通常表達方式是衡量暴露與疾病之間的關聯程度(希爾第一標準)。 大於單位的相對風險 (RR) 意味著暴露與疾病之間存在統計關聯。 例如,如果肝血管肉瘤的發病率通常為千萬分之一,但在接觸氯乙烯的人群中為十萬分之一,則 RR 為 1(即接觸氯乙烯的人的發病率增加了 10 倍)與不接觸氯乙烯的人相比,患血管肉瘤的風險)。
當風險隨著暴露水平的增加而增加(劑量反應效應,Hill 的第二個標準),以及當暴露和疾病之間的時間關係在生物學上有意義(暴露先於效應和這個“誘導”期的長度與疾病的生物學模型相容;Hill 的第三個標準)。 此外,當能夠在不同情況下複製發現的其他人獲得相似的結果時,關聯更有可能是因果關係(“一致性”,希爾的第四個標準)。
對結果進行科學分析需要評估生物學合理性(希爾的第五條標準)。 這可以通過不同的方式實現。 例如,一個簡單的標準是評估所謂的“原因”是否能夠到達目標器官(例如,沒有到達肺部的吸入物質不能在體內循環)。 此外,來自動物研究的支持性證據也很有幫助:在用氯乙烯治療的動物身上觀察到的肝血管肉瘤強烈強化了在人類身上觀察到的關聯。
觀察結果的內部連貫性(例如,兩性的 RR 同樣增加)是一個重要的科學標準(希爾的第六條標準)。 當關係非常具體時,因果關係更有可能——即涉及罕見原因和/或罕見疾病,或特定組織學類型/患者亞組(希爾的第七條標準)。
“枚舉歸納法”(暴露與疾病之間關聯實例的簡單枚舉)不足以完全描述因果推理中的歸納步驟。 通常,枚舉歸納的結果會產生復雜且仍然混亂的觀察結果,因為不同的因果鏈,或者更常見的是,真正的因果關係和其他不相關的暴露被糾纏在一起。 必須通過“排除歸納法”排除替代解釋,表明關聯很可能是因果關係,因為它不會與其他解釋“混淆”。 另一種解釋的簡單定義是“一個外來因素,其影響與利息風險的影響混合在一起,從而扭曲了對利息風險的風險估計”(Rothman 1986)。
歸納的作用是擴展知識,而演繹的作用是“傳遞真理”(Giere 1979)。 演繹推理會仔細檢查研究設計並確定在經驗上不正確但在邏輯上正確的關聯。 這種聯想不是事實,而是邏輯上的必然。 例如,一個 選擇偏見 當在病人中選擇暴露組時(例如當我們開始一項隊列研究招募“暴露於”一組肝血管肉瘤病例的氯乙烯時)或在健康人中選擇未暴露組時,就會發生這種情況。 在這兩種情況下,在暴露和疾病之間發現的關聯是必然的(邏輯上)但經驗上不是真實的(Vineis 1991)。
總而言之,即使考慮其觀察(非實驗)性質,流行病學也不使用與其他科學學科的傳統有很大不同的推理程序(Hume 1978;Schaffner 1993)。
流行病學研究中的倫理問題
由於推斷因果關係的微妙之處,流行病學家在解釋他們的研究時必須特別小心。 確實,由此產生了一些道德問題。
流行病學研究中的倫理問題已成為激烈討論的主題(Schulte 1989;Soskolne 1993;Beauchamp 等人 1991)。 原因很明顯:流行病學家,尤其是職業和環境流行病學家,經常研究具有重大經濟、社會和衛生政策影響的問題。 關於特定化學品暴露與疾病之間關聯的負面和正面結果都會影響成千上萬人的生活,影響經濟決策,從而嚴重影響政治選擇。 因此,流行病學家可能會受到壓力,並受到其他人的誘惑甚至鼓勵,以輕微或實質性地改變對其調查結果的解釋。
在幾個相關問題中, 透明度 數據收集、編碼、計算機化和分析的過程是對研究人員的偏見指控進行辯護的核心。 同樣重要且可能與這種透明度相衝突的是,參與流行病學研究的受試者有權受到保護,不被洩露個人信息
(保密 問題)。
從特別是在因果推理的背景下可能出現的不當行為的角度來看,道德準則應解決的問題是:
就職業和環境流行病學而言,其他關鍵問題涉及工人參與研究的初步階段,以及將研究結果發布給已登記並受到直接影響的受試者(Schulte 1989 ). 不幸的是,參加流行病學研究的工作人員參與關於研究目的、其解釋和研究結果的潛在用途(可能對工作人員有利和不利)的協作討論並不常見。
最近的指南(Beauchamp 等人 1991 年;CIOMS 1991 年)對這些問題提供了部分答案。 然而,在每個國家,職業流行病學家的專業協會應該就倫理問題進行徹底的討論,並可能採用一套適合當地情況的倫理指南,同時承認國際公認的規範實踐標準。
在台灣這樣的國家,職業病的記錄對職業醫生來說是一個挑戰。 由於缺乏包含材料安全數據表 (MSDS) 的系統,工人通常不知道他們工作時使用的化學品。 由於許多職業病潛伏期長,在臨床表現出來之前不會表現出任何特定的症狀和體徵,因此識別和識別職業病原體往往非常困難。
為了更好地控制職業病,我們訪問了數據庫,其中提供了相對完整的工業化學品清單以及一組特定的體徵和/或症狀。 結合猜想和反駁(即考慮並排除所有可能的替代解釋)的流行病學方法,我們記錄了十多種職業病和肉毒桿菌中毒的爆發。 我們建議將類似的方法應用於處於類似情況的任何其他國家,並提倡和實施一種涉及每種化學品的識別表(例如 MSDS)的系統,作為一種能夠迅速識別並因此預防職業性疾病。
彩印廠的肝炎
1985年,彩印廠三名工人因急性肝炎住進社區醫院。 三者中的一者疊加了急性腎功能衰竭。 由於病毒性肝炎在台灣的流行率很高,我們應該在最可能的病因中考慮病毒起源。 酒精和藥物的使用以及工作場所的有機溶劑也應包括在內。 由於台灣沒有 MSDS 系統,員工和雇主都不知道工廠使用的所有化學品(Wang 1991)。
我們必須從幾個毒理學數據庫中編制一份肝毒性和腎毒性藥物清單。 然後,我們從上述假設中推導出所有可能的推論。 例如,如果甲型肝炎病毒(HAV)是病原體,我們應該在受影響的工人中觀察抗體(HAV-IgM); 如果乙型肝炎病毒是病因,與未受影響的工人相比,我們應該在受影響的工人中觀察到更多的乙型肝炎表面抗原 (HBsAg) 攜帶者; 如果酒精是主要病因,我們應該在受影響的工人中觀察到更多的酗酒者或長期酗酒者; 如果任何有毒溶劑(例如氯仿)是病因,我們應該在工作場所找到它。
我們對每位工人進行了全面的醫療評估。 病毒病原學和酒精假說很容易被駁倒,因為它們沒有證據支持。
相反,該工廠的 17 名工人中有 25 人的肝功能測試異常,並且發現肝功能異常的存在與最近在三個房間中的任何一個房間內工作的歷史之間存在顯著關聯,其中互連的空調系統已被關閉安裝以冷卻印刷機。 在按乙型肝炎攜帶者狀況進行分層後,該關聯仍然存在。後來確定,該事件是在無意中使用“清潔劑”(即四氯化碳)清潔印刷機中的泵後發生的。 此外,泵清洗操作的模擬測試顯示環境空氣中的四氯化碳濃度為 115 至 495 ppm,這可能會導致肝損傷。 在進一步的反駁嘗試中,通過消除工作場所的四氯化碳,我們發現不再有新病例發生,所有受影響的工人在離開工作場所20天后都有所改善。 因此,我們得出結論,此次疫情是由四氯化碳的使用引起的。
彩印廠的神經症狀
1986年1991月,彰化彩印廠學徒突然雙側急性無力、呼吸麻痺。 受害人的父親在電話中稱,還有其他幾名工人也有類似症狀。 由於曾有彩色印刷廠因接觸有機溶劑而導致職業病的記錄,因此我們前往工地確定病因,並假設可能是溶劑中毒(Wang XNUMX)。
然而,我們通常的做法是考慮所有替代猜想,包括其他醫學問題,包括上運動神經元、下運動神經元以及神經肌肉接頭的功能受損。 同樣,我們從上述假設中推導出結果陳述。 例如,如果據報導任何溶劑(如正己烷、甲基丁酮、丙烯酰胺)是引起多發性神經病的原因,它也會損害神經傳導速度 (NCV); 如果是涉及上運動神經元的其他醫學問題,則會出現意識障礙和/或不自主運動的跡象。
現場觀察顯示,所有受影響的工人在整個臨床過程中都有清晰的意識。 對三名受影響的工人進行的 NCV 研究顯示下運動神經元完好無損。 沒有不自主運動,在出現症狀之前沒有服藥史或咬傷史,新斯的明試驗呈陰性。 發現26月27日或32日在工廠食堂吃早餐與生病有顯著關聯; 這兩天,XNUMX 名受影響工人中有 XNUMX 人與 XNUMX 名未受影響工人中有 XNUMX 人在工廠吃早餐。 進一步化驗結果顯示,一家無牌公司生產的花生罐頭內檢出A型肉毒桿菌毒素,其標本亦顯示長滿A型肉毒桿菌毒素。 肉毒桿菌. 最終的駁回審判是將此類產品從商業市場上撤下,這導致沒有新案件。 該調查記錄了台灣商業食品中的第一例肉毒桿菌中毒病例。
百草枯製造商的癌前皮膚損傷
1983 年 1985 月,一家百草枯製造廠的兩名工人到一家皮膚科診所就診,抱怨他們暴露在陽光下的手、頸部和麵部出現多處雙側色素沉著過度斑點和過度角化變化。 一些皮膚標本也顯示出 Bowenoid 變化。 由於在聯吡啶製造工人中報告了惡性和癌前皮膚損傷,因此強烈懷疑是職業原因。 然而,我們還必須考慮皮膚癌的其他替代原因(或假設),例如暴露於電離輻射、煤焦油、瀝青、煤煙或任何其他多環芳烴 (PAH)。 為了排除所有這些猜想,我們在 28 年進行了一項研究,訪問了所有 1987 家曾經從事百草枯製造或包裝的工廠,並檢查了製造過程和工人(Wang et al. 1993;Wang XNUMX)。
我們檢查了 228 名工人,除陽光和 4'-4'-聯吡啶及其異構體外,他們都沒有接觸過上述皮膚致癌物。 在排除多次接觸的工人後,我們發現七分之一的管理人員和八十二名百草枯包裝工人中的兩名出現色素沉著過度的皮膚病變,而三分之三的工人只涉及聯吡啶結晶和離心。 此外,所有 82 名患有角化過度或 Bowen 病灶的工人都有直接接觸聯吡啶及其異構體的歷史。 接觸聯吡啶的時間越長,皮膚損傷的可能性越大,分層和邏輯回歸分析表明,這種趨勢不能用陽光或年齡來解釋。 因此,皮膚損傷暫時歸因於聯吡啶暴露和陽光的組合。 如果在包含所有涉及聯吡啶暴露的過程後發生任何新案例,我們將進一步反駁嘗試跟進。 沒有發現新病例。
討論和結論
以上三個例子說明了採用反駁的方式和建立職業病數據庫的重要性。 前者使我們總是以與最初的直覺假設相同的方式考慮備選假設,而後者提供了一份詳細的化學試劑清單,可以指導我們找到真正的病因。 這種方法的一個可能限制是我們只能考慮那些我們可以想像的替代解釋。 如果我們的備選方案列表不完整,我們可能得不到答案或得到錯誤答案。 因此,全面的職業病數據庫對於這一戰略的成功至關重要。
我們曾經費力地構建自己的數據庫。 然而,最近發布的 OSH-ROM 數據庫包含超過 160,000 條摘要的 NIOSHTIC 數據庫,可能是用於此目的的最全面的數據庫之一,正如本文其他部分所討論的那樣 百科全書. 此外,如果發生新的職業病,我們可能會搜索這樣的數據庫並排除所有已知的病原體,並且無一例外。 在這種情況下,我們可能會嘗試盡可能具體地識別或定義新代理人(或職業設置),以便首先緩解問題,然後檢驗進一步的假設。 百草枯製造商的癌前皮膚病變案例就是此類的一個很好的例子。
問卷調查在流行病學研究中的作用
流行病學研究通常是為了回答一個特定的研究問題,該問題涉及個人接觸有害物質或情況以及隨後的健康結果,例如癌症或死亡。 幾乎所有此類調查的核心都是構成基本數據收集工具的調查問卷。 即使要在工作場所環境中進行物理測量,尤其是要從暴露或未暴露的研究對像中收集生物材料(例如血清)時,問卷調查也是必不可少的,以便通過系統地收集個人和其他方面的信息來形成充分的暴露情況以有組織和統一的方式呈現特徵。
調查問卷具有許多重要的研究功能:
問卷設計在總體研究目標中的位置
雖然問卷通常是流行病學研究中最明顯的部分,尤其是對工作人員或其他研究參與者而言,但它只是一種工具,實際上通常被研究人員稱為“工具”。 圖 1 以非常籠統的方式描述了調查設計從構思到數據收集和分析的各個階段。 該圖顯示了在整個研究過程中平行進行的四個層次或層級的研究操作:抽樣、問卷調查、操作和分析。 該圖非常清楚地展示了問卷開發階段與總體研究計劃相關的方式,從最初的大綱到問卷及其相關代碼的初稿,然後在選定的一個或多個子人群中進行預測試根據預測試經驗進行修改,並為現場實際數據收集準備最終文件。 最重要的是背景:問卷開發的每個階段都與總體抽樣計劃的創建和完善的相應階段以及問捲管理的操作設計相結合。
圖1。 調查的階段
研究類型和問卷
研究本身的研究目標決定了問卷的結構、長度和內容。 這些調查問卷的屬性總是受到數據收集方法的影響,數據收集方法通常屬於三種模式之一:親自、郵寄和電話。 每一種都有其優點和缺點,這不僅會影響數據的質量,還會影響整個研究的有效性。
A 郵寄問卷 是最便宜的形式,可以覆蓋廣泛地理區域的工人。 然而,由於總體答复率通常較低(通常為 45% 至 75%),因此不能過於復雜,因為幾乎沒有或根本沒有機會澄清問題,並且可能難以確定對關鍵暴露或其他問題的潛在反應受訪者和非受訪者之間的問題系統地不同。 物理佈局和語言必須適合受教育程度最低的潛在研究參與者,並且必須能夠在相當短的時間內完成,通常為 20 到 30 分鐘。
電話問卷 可用於以人口為基礎的研究——即對地理上定義的人口樣本進行調查的調查——並且是更新現有數據文件中信息的實用方法。 它們在語言和內容方面可能比郵寄問卷更長、更複雜,而且由於它們由訓練有素的訪調員管理,電話調查的更高成本可以通過物理構建有效管理的問卷(例如通過跳過模式)來部分抵消。 答复率通常比郵寄問卷要好,但會受到與電話答錄機的使用增加、拒絕、非接觸和電話服務有限的人群問題相關的偏見的影響。 這種偏差通常與抽樣設計本身有關,而不是特別與問卷有關。 儘管電話問卷在北美使用已久,但其在世界其他地區的可行性尚未確定。
面對面 訪談為收集準確的複雜數據提供了最好的機會; 它們的管理成本也是最高的,因為它們需要專業工作人員的培訓和差旅費。 可以安排問題的物理佈局和順序以優化管理時間。 利用面對面訪談的研究通常具有最高的響應率,並且受到最少的響應偏差影響。 這也是訪談者最有可能了解參與者是否為病例(在病例對照研究中)或參與者的暴露狀態(在隊列研究中)的訪談類型。 因此,必須注意通過培訓採訪者避免引導性問題和可能引起偏見反應的肢體語言來保持採訪者的客觀性。
使用a變得越來越普遍 混合研究設計 其中復雜的暴露情況通過個人或電話採訪進行評估,允許最大程度的探究和澄清,然後郵寄問卷以獲取生活方式數據,如吸煙和飲食。
保密和研究參與者問題
由於問卷的目的是獲取有關個人的數據,因此問卷設計必須遵循既定的人類受試者倫理治療標準。 這些指南適用於問卷數據的獲取,就像它們適用於血液和尿液等生物樣本或基因檢測一樣。 在美國和許多其他國家/地區,除非首先獲得適當的機構審查委員會對問卷語言和內容的批准,否則不得使用公共資金進行任何涉及人類的研究。 此類批准旨在確保問題僅限於合法的研究目的,並且不會侵犯研究參與者自願回答問題的權利。 必須向參與者保證,他們參與研究完全是自願的,拒絕回答問題或什至根本不參與不會使他們受到任何處罰或改變他們與雇主或醫生的關係。
還必須向參與者保證,他們提供的信息將由調查人員嚴格保密,他們當然必須採取措施維護數據的物理安全和不可侵犯性。 這通常需要將有關參與者身份的信息與計算機化數據文件進行物理分離。 通常的做法是告知研究參與者,他們對問卷項目的答復將僅用於與統計報告中其他參與者的答复匯總,不會向雇主、醫生或其他方披露。
問卷設計的測量方面
問卷最重要的功能之一是以定性或定量形式獲取有關個人某些方面或屬性的數據。 有些項目可能像體重、身高或年齡一樣簡單,而其他項目可能相當複雜,例如個人對壓力的反應。 定性反應,例如性別,通常會轉換為數值變量。 所有這些措施都可以通過其有效性和可靠性來表徵。 有效性是指問卷得出的數字接近其真實但可能未知的值的程度。 可靠性衡量給定測量重複產生相同結果的可能性,無論該結果是否接近“真實”。 圖 2 顯示了這些概念之間的關係。 它表明測量可以有效但不可靠、可靠但無效或既有效又可靠。
圖 2. 有效性和可靠性關係
多年來,研究人員開發了許多問卷,以回答廣泛感興趣的研究問題。 示例包括衡量學生未來學業成就潛力的學術能力測驗,以及衡量某些社會心理特徵的明尼蘇達多相人格問卷 (MMPI)。 心理測量學一章討論了各種其他心理指標。 還有已建立的生理量表,例如英國醫學研究委員會 (BMRC) 肺功能問卷。 這些儀器有許多重要的優點。 其中最主要的是它們已經被開發和測試過,通常在許多人群中,並且它們的可靠性和有效性是眾所周知的。 如果適合研究目的,建議任何構建問卷的人使用此類量表。 它們不僅節省了“重新發明輪子”的努力,而且使研究結果更有可能被研究界接受為有效。 它還可以對來自不同研究的結果進行更有效的比較,前提是它們已被正確使用。
前面的量表是兩種重要測量類型的示例,它們常用於問卷調查中,以量化概念,這些概念可能無法像身高和體重那樣完全客觀地測量,或者需要許多類似的問題才能完全“挖掘領域”一種特定的行為模式。 更一般地說,索引和量表是兩種數據縮減技術,它們提供問題組的數字摘要。 以上例子說明了生理和心理指標,它們也經常被用來衡量知識、態度和行為。 簡而言之,一個 指數 通常構建為通過在一組相關問題中計算適用於研究參與者的項目數而獲得的分數。 例如,如果一份問卷列出了一系列疾病,那麼疾病史指數可以是受訪者說他或她曾經患過的疾病的總數。 一種 規模 是基於參與者回答一個或多個相關問題的強度的綜合度量。 例如,在社會研究中經常使用的李克特量表通常由人們可能強烈同意、不太同意、不發表意見、較弱不同意或強烈不同意的陳述構成,反應被評分為從 1 5. 量表和指標可以相加或以其他方式組合,以形成研究參與者的身體、心理、社會或行為特徵的相當複雜的圖景。
有效性值得特別考慮,因為它反映了“真相”。 經常討論的三種重要的效度類型是表面效度、內容效度和標準效度。 表面效度 是指標的主觀質量,可確保問題的措辭清晰明確。 內容有效性 確保問題將有助於挖掘研究人員感興趣的響應維度。 標準 (或預測) 合法性 源自對問卷測量與單獨可測量數量的接近程度的客觀評估,例如,根據飲食記錄記錄的食物消費,對膳食維生素 A 攝入量的問卷評估與維生素 A 的實際消耗量相匹配的程度。
問卷內容、質量和長度
措辭. 問題的措辭既是一門藝術,也是一門專業技能。 因此,只能提供最通用的指南。 人們普遍認為應該設計以下問題:
問題順序和結構。 問題的順序和呈現方式都會影響所收集信息的質量。 一份典型的調查問卷,無論是自行填寫還是由訪調員閱讀,都包含一個序言,向受訪者介紹研究及其主題,提供他或她需要的任何其他信息,並試圖激勵受訪者回答問題。 大多數調查問卷包含一個部分,旨在收集人口統計信息,例如年齡、性別、種族背景和有關參與者背景的其他變量,包括可能的混雜變量。 數據收集的主要主題,例如工作場所的性質和對特定物質的接觸,通常是一個獨特的問卷部分,並且通常在它自己的介紹性序言之前,可能首先提醒參與者工作的特定方面或工作場所,以便為詳細問題創建上下文。 應安排旨在建立工作生活年表的問題佈局,以盡量減少按時間順序遺漏的風險。 最後,通常要感謝受訪者的參與。
問題類型。 設計者必須決定是使用開放式問題讓參與者自己作答,還是使用封閉式問題要求明確回答或從簡短的可能回答菜單中進行選擇。 封閉式問題的優點是,它們可以為受訪者闡明備選方案,避免倉促回答,並最大限度地減少可能無法解釋的冗長的漫無邊際的問題。 但是,它們要求設計人員預測潛在響應的範圍以避免丟失信息,尤其是在許多工作場所發生的意外情況下。 這反過來又需要精心策劃的試點測試。 研究者必須決定是否以及在何種程度上允許“不知道”的回答類別。
長度。 確定問卷的最終長度需要在希望獲得盡可能多的詳細信息以實現研究目標與以下事實之間取得平衡:如果問卷太長,在某些時候許多受訪者會失去興趣並停止響應或倉促、不准確和不假思索地做出反應,以結束會議。 另一方面,很短的問卷可能會獲得很高的回复率,但達不到研究目標。 由於受訪者的動機通常取決於個人對結果的利害關係,例如改善工作條件,因此對冗長問卷的容忍度可能有很大差異,尤其是當某些參與者(例如特定工廠的工人)可能認為他們的利害關係高於其他人(例如通過隨機撥打電話聯繫的人)。 這種平衡只能通過試點測試和經驗來實現。 訪談員管理的問卷應記錄開始和結束時間,以便計算訪談的持續時間。 此信息有助於評估數據的質量水平。
語言。 必須使用民眾的語言來讓所有人理解問題。 這可能需要熟悉在任何一個國家/地區可能有所不同的地方方言。 即使在名義上使用同一種語言的國家,如英國和美國,或拉丁美洲的西班牙語國家,當地的習語和用法也可能有所不同,從而使解釋變得模糊。 例如,在美國,“茶”僅僅是一種飲料,而在英國,它可能意味著“一壺茶”、“下午茶”或“主要的晚餐”,這取決於地點和語境。 避免使用科學術語尤為重要,除非可以預期研究參與者擁有特定的技術知識。
清晰度和引導性問題。 雖然通常情況下較短的問題更清晰,但也有例外,尤其是在需要介紹複雜主題的情況下。 儘管如此,簡短的問題可以澄清思路並減少不必要的詞語。 它們還減少了讓受訪者承受過多信息而無法消化的機會。 如果研究的目的是獲得有關參與者工作情況的客觀信息,重要的是要以中立的方式提出問題並避免可能有利於特定答案的“引導性”問題,例如“您是否同意您的工作場所環境對你的健康有害嗎?”
問捲布局。 問卷的物理佈局會影響研究的成本和效率。 自填式問卷比訪調員進行的問卷更重要。 設計為由受訪者完成但過於復雜或難以閱讀的問卷可以隨意填寫甚至丟棄。 即使是設計為由訓練有素的訪調員大聲朗讀的問卷也需要以清晰易讀的類型打印,並且必須以保持穩定的提問流程並最大限度地減少翻頁和搜索下一個適用問題的方式來指示跳過問題的方式題。
有效性問題
偏見
客觀數據收集的敵人是偏見,這是由人群之間系統但計劃外的差異造成的:病例對照研究中的病例和對照,或隊列研究中的暴露和非暴露。 信息偏差 當兩組參與者對同一個問題的理解或反應不同時,可能會引入。 例如,如果問題的提出方式要求對工作場所或其暴露的特殊技術知識,而暴露的工人可以理解,但一般公眾不一定會理解,因此可能會發生這種情況。
使用代理人代替生病或已故的工人可能會產生偏見,因為近親可能會以不同的方式回憶起信息,而且準確度低於工人本人。 在一些直接與研究參與者進行訪談而另一些訪談是與其他研究參與者的親屬或同事進行的研究中,這種偏見的引入尤其可能。 在任何一種情況下,都必須注意減少訪談者對疾病的了解或相關工作人員的暴露狀況可能產生的任何影響。 由於不可能總是讓訪調員“失明”,因此重要的是要強調客觀性,並在培訓期間避免引導性或暗示性問題或無意識的肢體語言,並在研究進行時監控績效。
回憶偏差 當個案和控制“記住”不同的暴露或工作情況時的結果。 與通過電話隨機聯繫的人相比,患有潛在職業相關疾病的住院病例可能更能回憶起其病史或職業暴露的詳細信息。 這種越來越普遍的偏見類型已被標記為 社會期望偏差. 它描述了許多人有意或無意地低估他們沉迷於吸煙或食用高脂肪和高膽固醇食物等“壞習慣”,並誇大鍛煉等“好習慣”的傾向。
反應偏差 表示這樣一種情況,其中一組研究參與者,例如具有特定職業暴露的工人,可能比未暴露的人更有可能完成問卷調查或以其他方式參與研究。 這種情況可能導致對暴露與疾病之間關聯的估計有偏差。 如果響應率或完成問卷或訪談所花費的時間在組之間存在顯著差異(例如,病例與對照組、暴露與未暴露),則可能會懷疑響應偏差。 響應偏差通常因問捲管理模式而異。 郵寄的問卷通常更有可能被認為對研究結果有利害關係的個人退回,也更有可能被從一般人群中隨機選擇的人忽略或丟棄。 許多利用郵件調查的調查人員還建立了後續機制,其中可能包括第二次和第三次郵寄以及隨後與未答复者的電話聯繫,以最大限度地提高答复率。
利用電話調查的研究,包括那些利用隨機撥號來識別控制的研究,通常有一套規則或協議來定義必須嘗試聯繫潛在受訪者的次數,包括一天中的時間,以及是晚上還是晚上應該嘗試週末打電話。 進行以醫院為基礎的研究的人通常會記錄拒絕參與的患者人數以及不參與的原因。 在所有這些情況下,各種措施 回复率 記錄下來,以便評估實際達到目標人群的程度。
選擇偏見 當一組參與者優先響應或以其他方式參與研究時的結果,並且可能導致對暴露與疾病之間關係的估計有偏差。 為了評估選擇偏差以及它是否會導致對暴露的低估或高估,可以使用教育水平等人口統計信息來比較受訪者與非受訪者。 例如,如果受教育程度低的參與者的反應率低於受教育程度高的參與者,並且如果已知特定職業或吸煙習慣在受教育程度較低的群體中更常見,則選擇偏差會低估該職業或吸菸類別的暴露很可能已經發生。
混淆 是一種重要的選擇偏差類型,當受訪者的選擇(病例對照研究中的病例和對照,或隊列研究中的暴露和未暴露)在某種程度上取決於第三個變量時,有時以某種方式不為研究者所知研究者。 如果不加以識別和控制,它可能會不可預測地導致低估或高估與職業暴露相關的疾病風險。 混淆通常通過操縱研究本身的設計(例如,通過匹配案例來控制年齡和其他變量)或在分析階段處理。 這些技術的詳細信息在本章的其他文章中介紹。
文档
在任何研究中,所有研究程序都必須完整記錄,以便所有工作人員,包括訪談員、監督人員和研究人員,清楚他們各自的職責。 在大多數基於問卷調查的研究中, 編碼手冊 準備好了,它逐個問題地描述了面試官需要知道的除了問題的字面措辭之外的一切。 這包括對分類響應進行編碼的說明,並且可能包含有關探查的明確說明,列出允許和不允許的問題。 在許多研究中,在該領域偶爾會遇到針對某些問題的新的、無法預料的回答選擇; 這些必須記錄在主密碼本中,並及時向所有訪調員分發補充、更改或新指令的副本。
計劃、測試和修訂
從圖 1 可以看出,問卷的開發需要經過深思熟慮 規劃. 每個問卷都需要在幾個階段進行測試,以確保問題“有效”,即它們是可以理解的並產生預期質量的答复。 對志願者測試新問題然後詳細詢問他們以確定具體問題的理解程度以及遇到的問題或歧義的類型是有用的。 結果可用於 修改問卷, 如有必要,可以重複該過程。 志願者有時被稱為“焦點小組”。
所有流行病學研究都需要 試點測試,不僅適用於問卷,還適用於研究程序。 一份設計良好的問卷只有在能夠有效地傳遞給研究參與者時才能發揮作用,而這只能通過實地測試程序並在必要時進行調整來確定。
面試官培訓和監督
在通過電話或面對面訪談進行的研究中,訪談者起著至關重要的作用。 此人不僅負責向研究參與者提出問題並記錄他們的回答,還負責解釋這些回答。 即使是結構最嚴格的訪談研究,受訪者偶爾也會要求澄清問題,或提供不符合可用回答類別的回答。 在這種情況下,採訪者的工作是以符合研究人員意圖的方式解釋問題或回答。 要有效且始終如一地做到這一點,需要有經驗的研究人員或管理人員進行培訓和監督。 當一項研究僱用了不止一名採訪者時,採訪者培訓對於確保以統一的方式提出問題和解釋回答尤為重要。 在許多研究項目中,這是在小組培訓環境中完成的,並定期(例如,每年)重複,以保持採訪者的技能新鮮。 培訓研討會通常非常詳細地涵蓋以下主題:
研究監督通常需要現場觀察,其中可能包括為隨後的解剖採訪錄音。 主管在批准和提交數據輸入之前親自審查每份問卷是一種常見的做法。 主管還為採訪者制定和執行績效標準,並且在一些研究中,對選定的參與者進行獨立的重新採訪,作為可靠性檢查。
數據收集
向研究參與者實際分發調查問卷並隨後收集分析是使用上述三種模式之一進行的:通過郵件、電話或親自。 一些研究人員在他們自己的機構內組織甚至執行這一職能。 雖然高級調查員熟悉第一手調查的動態有相當大的好處,但將訓練有素且受到良好監督的專業調查員納入研究團隊是最具成本效益的,並且有利於保持高質量的數據.
一些研究人員與專門從事調查研究的公司簽訂合同安排。 承包商可以提供一系列服務,其中可能包括以下一項或多項任務:分發和收集調查問卷、進行電話或面對面訪談、獲取血液或尿液等生物樣本、數據管理以及統計分析和報告寫作。 無論支持級別如何,承包商通常負責提供有關響應率和數據質量的信息。 然而,研究人員對研究的科學完整性負最終責任。
可靠性和重新面試
可以通過重新採訪原始研究參與者的樣本來評估數據質量。 這提供了一種方法來確定初始訪談的可靠性,並估計響應的可重複性。 不需要重新管理整個問卷; 問題的一個子集通常就足夠了。 統計測試可用於評估同一參與者在不同時間提出的一組問題的可靠性,以及評估不同參與者提供的回答的可靠性,甚至是不同採訪者詢問的那些問題(即內部和內部) - 評分者評估)。
問卷處理技術
計算機技術的進步創造了許多不同的方式來獲取調查問卷數據並提供給研究人員進行計算機分析。 可以通過三種根本不同的方式將數據計算機化:實時(即,當參與者在訪談中作出回應)、傳統的按鍵輸入方法和光學數據捕獲方法。
計算機輔助數據採集
許多研究人員現在使用計算機來收集對面對面和電話採訪中提出的問題的回答。 該領域的研究人員發現使用膝上型電腦很方便,這些電腦被編程為按順序顯示問題,並允許採訪者立即輸入回答。 進行電話採訪的調查研究公司開發了類似的系統,稱為計算機輔助電話採訪 (CATI) 系統。 與更傳統的紙質問卷相比,這些方法有兩個重要的優點。 首先,可以根據一系列允許的答案立即檢查回答,並檢查是否與以前的回答一致,並且可以立即引起採訪者和受訪者的注意。 這大大降低了錯誤率。 其次,可以對跳過模式進行編程以最大限度地減少管理時間。
最常用的數據計算機化方法仍然是傳統的 鍵輸入 由訓練有素的操作員。 對於非常大的研究,問卷通常會發送給專門從事數據採集的專業合同公司。 這些公司經常使用專門的設備,允許一個操作員鍵入一份問卷(有時稱為程序 按鍵 由於歷史原因)和第二個操作員重新輸入相同的數據,這個過程稱為 密鑰驗證. 將第二次鍵入的結果與第一次進行比較,以確保數據輸入正確。 可以對質量保證程序進行編程,以確保每個響應都在允許的範圍內,並且與其他響應一致。 生成的數據文件可以通過磁盤、磁帶或通過電話或其他計算機網絡以電子方式傳輸給研究人員。
對於較小的研究,有許多基於 PC 的商業程序,這些程序具有模擬更專業系統的數據輸入功能。 其中包括數據庫程序,例如 dBase、Foxpro 和 Microsoft Access,以及電子表格,例如 Microsoft Excel 和 Lotus 1-2-3。 此外,許多主要用於統計數據分析的計算機程序包都包含數據輸入功能,例如 SPSS、BMDP 和 EPI INFO。
一種適用於某些專門問卷的廣泛使用的數據捕獲方法使用光學系統。 光學標記讀取 或光學傳感用於讀取專門為參與者設計的問卷答复,通過標記小矩形或圓形(有時稱為“氣泡代碼”)來輸入數據。 當每個人完成他或她自己的調查問卷時,這些工作最有效。 更複雜和昂貴的設備可以讀取手印字符,但目前這不是大規模研究中捕獲數據的有效技術。
存檔問捲和編碼手冊
因為信息是一種寶貴的資源並且會受到解釋和其他影響,研究人員有時會被要求與其他研究人員分享他們的數據。 共享數據的請求可能出於多種原因,可能是出於對複制報告的真誠興趣,也可能是擔心數據可能未被正確分析或解釋。
如果懷疑或指控存在偽造或偽造數據的情況,則必須提供報告結果所依據的原始記錄以供審計之用。 除了原始問捲和/或原始數據的計算機文件之外,研究人員必須能夠提供為研究開發的編碼手冊和課程中所有數據更改的日誌以供審查數據編碼、計算機化和分析。 例如,如果一個數據值因為它最初表現為異常值而被更改,那麼更改記錄和進行更改的原因應該記錄在日誌中,以供可能的數據審計之用。 此類信息在編寫報告時也很有價值,因為它可以提醒人們實際上是如何處理導致報告結果的數據的。
出於這些原因,研究完成後,研究人員有義務確保所有基本數據都妥善存檔一段合理的時間,並且如果研究人員被要求提供這些數據,則可以檢索這些數據。
經常引用工作場所危害的幾個例子,不僅可以舉例說明與工作場所暴露相關的可能的不利健康影響,而且還可以揭示對工人群體進行系統研究的方法如何揭示重要的暴露與疾病關係。 一個這樣的例子是石棉。 勞倫斯·加芬克爾 (Lawrence Garfinkel) 的一篇文章記錄了已故歐文·J·塞利科夫 (Irving J. Selikoff) 博士簡單優雅地證明了石棉工人患癌症風險升高的情況。 經 CA-A 臨床醫生癌症雜誌 (Garfinkel 1984) 許可,此處僅稍作修改即可重印。 這些表格來自 Selikoff 博士及其同事 (1964) 的原始文章。
接觸石棉已成為一個相當嚴重的公共衛生問題,其影響已超出衛生專業人員的直接領域,延伸到立法者、法官、律師、教育工作者和其他有關社區領袖所服務的領域。 因此,與石棉有關的疾病越來越受到臨床醫生和衛生當局以及消費者和廣大公眾的關注。
歷史背景
石棉是一種非常有用的礦物,幾個世紀以來一直以多種方式加以利用。 芬蘭的考古研究表明,早在公元前 2500 年,陶器中就含有石棉纖維。 公元前5世紀,它被用作燈芯。 大約在公元前 456 年,希羅多德 (Herodotus) 就使用石棉布進行火葬發表了評論。 石棉在 15 世紀用於防彈衣,在俄羅斯用於製造紡織品、手套、襪子和手袋 c. 1720年,雖然石棉織造技藝是從什麼時候開始發展起來的,已無定論,但我們知道,古人常以亞麻織石棉。 商業石棉生產始於 1850 年左右的意大利,用於造紙和布料。
大約 1880 年,加拿大和南非石棉礦業的發展降低了成本並刺激了石棉產品的生產。 不久之後,美國、意大利和俄羅斯開始開采和生產石棉。 在美國,石棉作為管道絕緣材料的開發增加了產量,此後不久被用於其他各種用途,包括剎車片、水泥管、防護服等。
美國的產量從 6,000 年的約 1900 噸增加到 650,000 年的 1975 噸,儘管到 1982 年約為 300,000 噸,到 1994 年,產量下降到 33,000 噸。
據報導,小普林尼(Pliny the Younger,公元 61-113 年)曾評論過與石棉打交道的奴隸的疾病。 與採礦相關的職業病的提法出現在 16 世紀,但直到 1906 年在英國才首次出現石棉工人肺纖維化的提法。 此後不久,法國和意大利報導了涉及石棉製造應用的工人死亡人數過多,但 1924 年英國開始對石棉誘發疾病的主要認識。到 1930 年,Wood 和 Gloyne 報告了 37 例肺纖維化病例。
1935 年首次提到“石棉矽肺”患者的肺癌。隨後出現了其他幾例病例報告。 1947 年、1949 年和 1951 年出現了死於石棉沉著病的患者患肺癌的比例很高的報告。1955 年,英國的 Richard Doll 報導了自 1935 年以來在石棉廠工作的人患肺癌的風險過高,特別是高受僱超過 20 年的人的風險。
臨床觀察
正是在這樣的背景下,Irving Selikoff 博士開始了對石棉相關疾病的臨床觀察。 塞利科夫博士當時已經是一位傑出的科學家。 他之前的成就包括開發和首次使用異煙肼治療結核病,為此他於 1952 年獲得了拉斯克獎。
在 1960 世紀 XNUMX 年代初,作為一名在新澤西州帕特森執業的胸科醫生,他在該地區一家石棉廠的工人中發現了許多肺癌病例。 他決定擴大他的觀察範圍,將石棉絕緣子工會的兩名當地人包括在內,他們的成員也曾接觸過石棉纖維。 他認識到,仍有許多人不相信肺癌與接觸石棉有關,只有對接觸石棉的總人口進行徹底研究才能說服他們。 人群中的石棉接觸有可能與其他類型的癌症有關,例如胸膜間皮瘤和腹膜間皮瘤,正如某些研究中所建議的那樣,或許也與其他部位有關。 過去大多數關於石棉對健康影響的研究都與接觸石棉採礦和生產的工人有關。 重要的是要知道吸入石棉是否也會影響其他接觸石棉的人群。
Selikoff 博士聽說了時任美國癌症協會 (ACS) 統計研究部主任 E. Cuyler Hammond 博士的成就,並決定邀請他合作設計和分析一項研究。 哈蒙德博士撰寫了幾年前發表的具有里程碑意義的關於吸煙與健康的前瞻性研究。
哈蒙德博士立即看到了對石棉工人進行研究的潛在重要性。 儘管他正忙於分析當時新的 ACS 前瞻性研究——癌症預防研究 I (CPS I) 的數據,該研究是他幾年前開始的,但他還是欣然同意在“業餘時間”進行合作。 他建議將分析限制在那些至少有 20 年工作經驗的工人,因此他們接觸石棉的次數最多。
西奈山醫院 Selikoff 博士的助理研究員 Janet Kaffenburgh 女士加入了該團隊,她與 Hammond 博士一起準備了參與研究的男性名單,包括他們的年齡和就業日期,並獲得了數據根據工會總部記錄的死亡事實和原因。 這些信息隨後被轉移到文件卡上,這些文件卡由哈蒙德博士和卡芬堡夫人按字面意思在哈蒙德博士家客廳的地板上分類。
新澤西州帕特森巴納特紀念醫院中心的病理學家 Jacob Churg 博士提供了死因的病理學驗證。
表 1. 接觸石棉粉塵 632 年或更長時間的 20 名石棉工人的人年經驗
年齡 |
時間段 |
|||
1943-47 |
1948-52 |
1953-57 |
1958-62 |
|
35-39 |
85.0 |
185.0 |
7.0 |
11.0 |
40-44 |
230.5 |
486.5 |
291.5 |
70.0 |
45-49 |
339.5 |
324.0 |
530.0 |
314.5 |
50-54 |
391.5 |
364.0 |
308.0 |
502.5 |
55-59 |
382.0 |
390.0 |
316.0 |
268.5 |
60-64 |
221.0 |
341.5 |
344.0 |
255.0 |
65-69 |
139.0 |
181.0 |
286.0 |
280.0 |
70-74 |
83.0 |
115.5 |
137.0 |
197.5 |
75-79 |
31.5 |
70.0 |
70.5 |
75.0 |
80-84 |
5.5 |
18.5 |
38.5 |
23.5 |
85+ |
3.5 |
2.0 |
8.0 |
13.5 |
Total |
1,912.0 |
2,478.0 |
2,336.5 |
2,011.0 |
由此產生的研究屬於“回顧性進行的前瞻性研究”類型。 工會記錄的性質使得在相對較短的時間內完成對長期研究的分析成為可能。 雖然只有 632 名男性參與了這項研究,但有 8,737 人年暴露於風險中(見表 1); 在 255 年至 20 年的 1943 年觀察期內,有 1962 人死亡(見表 2)。 在表 28.17 中,可以看到觀察到的死亡人數總是超過預期人數,表明工作場所接觸石棉與癌症死亡率升高之間存在關聯。
表 2. 接觸石棉粉塵 632 年或更長時間的 20 名石棉工人的觀察和預期死亡人數
死亡原因 |
時間段 |
Total |
|||
1943-47 |
1948-52 |
1953-57 |
1958-62 |
1943-62 |
|
總計,所有原因 |
|||||
觀察(石棉工人) |
28.0 |
54.0 |
85.0 |
88.0 |
255.0 |
預期(美國白人男性) |
39.7 |
50.8 |
56.6 |
54.4 |
203.5 |
總癌症,所有地點 |
|||||
觀察(石棉工人) |
13.0 |
17.0 |
26.0 |
39.0 |
95.0 |
預期(美國白人男性) |
5.7 |
8.1 |
13.0 |
9.7 |
36.5 |
肺癌和胸膜癌 |
|||||
觀察(石棉工人) |
6.0 |
8.0 |
13.0 |
18.0 |
45.0 |
預期(美國白人男性) |
0.8 |
1.4 |
2.0 |
2.4 |
6.6 |
胃癌、結腸癌和直腸癌 |
|||||
觀察(石棉工人) |
4.0 |
4.0 |
7.0 |
14.0 |
29.0 |
預期(美國白人男性) |
2.0 |
2.5 |
2.6 |
2.3 |
9.4 |
所有其他部位的癌症合併 |
|||||
觀察(石棉工人) |
3.0 |
5.0 |
6.0 |
7.0 |
21.0 |
預期(美國白人男性) |
2.9 |
4.2 |
8.4 |
5.0 |
20.5 |
工作意義
這篇論文構成了我們對石棉相關疾病知識的轉折點,並為未來的研究指明了方向。 該文章自最初發表以來已被科學出版物至少引用 261 次。 在 ACS 和美國國立衛生研究院的資金支持下,Selikoff 博士和 Hammond 博士以及他們不斷壯大的礦物學家、胸科醫生、放射科醫生、病理學家、衛生學家和流行病學家團隊繼續探索石棉疾病的各個方面。
1968 年的一篇重要論文報導了吸煙對石棉暴露的協同效應(Selikoff、Hammond 和 Churg,1968 年)。 研究範圍擴大到包括石棉生產工人、在工作中間接接觸石棉的人(例如船廠工人)以及家庭接觸石棉的人。
在後來的分析中,美國癌症協會流行病學和統計助理副總裁赫伯特·塞德曼 (Herbert Seidman) 加入了該團隊,該團隊證明,即使是短期接觸石棉也會導致患癌症的風險顯著增加到 30 年後(Seidman、Selikoff 和 Hammond 1979)。 在這項針對 632 名絕緣子的首次研究中,只有三例間皮瘤病例,但後來的調查顯示,石棉工人的所有死亡中有 8% 是由於胸膜和腹膜間皮瘤。
隨著 Selikoff 博士科學研究的擴展,他和他的同事們通過工業衛生技術的創新為減少接觸石棉做出了顯著貢獻; 通過說服立法者了解石棉問題的緊迫性; 評估與石棉病有關的殘疾支付問題; 並調查石棉顆粒在供水和環境空氣中的一般分佈。
Selikoff 博士還通過組織有關該主題的會議和參加許多科學會議來呼籲醫學界和科學界對石棉問題的關注。 他的許多關於石棉疾病問題的情況介紹會都是專門為律師、法官、大公司總裁和保險業高管安排的。
" 免責聲明:國際勞工組織不對本門戶網站上以英語以外的任何其他語言呈現的內容負責,英語是原始內容的初始製作和同行評審所使用的語言。自此以來,某些統計數據尚未更新百科全書第 4 版的製作(1998 年)。”