簡介

許多呼吸道傳染病是通過密切的人際接觸傳播的。因此,預測感染傳播和疫苗接種等幹預措施的影響取決於能否量化個人之間的密切接觸者,特別是不同年齡組的混合情況。因此,在不同人群中開展了旨在了解呼吸道感染傳播情況的大規模基於人群的社會接觸調查123.4567891011121314151617181920.2122.衡量社會接觸的最常用方法是要求參與者報告他們在某一天在不同年齡群體中進行的接觸次數、在不同社會環境中進行的接觸的比例、接觸的持續時間,以及被認為對疾病傳播具有重要意義的其他特征(例如年齡、家庭規模)。123.4567891011121314151617181920.2122.然後,這些社會接觸數據被用於數學模型的參數化,以捕捉許多呼吸道感染(如百日咳)的傳播模式23、流感12132224252627呼吸道合胞病毒28和水痘2930.31.然而,這些數據隻適用於有限數量的人口,如選定的歐洲國家12456781022,日本9、廣東11、台灣14、越南15、泰國17、秘魯18、肯尼亞19、讚比亞20.、津巴布韋21和南非20..雖然由於香港人口密度極高,且與全球航空運輸網絡緊密相連,因此是新發傳染病的熱點和樞紐32,香港按年齡劃分的社會交往數據尚未公布。2009年在香港進行了一項包含血清學調查的社會接觸調查1333,但僅報告了少數年齡組的接觸者年齡,因此很難根據現有數據構建定製的特定年齡的接觸矩陣。

以往的社會接觸調查采用了多種方法(補充表S1).紙質問卷和在線問卷均已使用:所有大規模全人口調查均使用紙質問卷;2003年,在線問卷首次在比利時受過訓練的大學生中進行了試點調查1並在2008年澳大利亞的一項比較研究中進一步與紙質問卷進行了比較2;在後來的全人群社會接觸調查中,英國同時使用了在線問卷和紙質問卷6並作為日本除65歲以上老年人外所有年齡組的主要問卷調查模式9.社會交往數據主要通過兩種方式收集:1)訓練有素的麵試官通過要求參與者回顧性地描述他們前一天的活動來完成問卷11121314151820.;2)否則,參與者被要求在指定的一天內記錄每一次接觸410161921.目前尚不清楚問卷類型的模式(紙質vs電子)或參與者的記錄行為(前瞻性vs回顧性填寫問卷)是否會對報告的接觸數據產生實質性影響,這將進一步影響許多建模研究的穩健性1213222324252627282930.31

為了更好地參數化香港呼吸道感染的建模研究,我們在2015/16年度進行了一項基於人群的社會接觸調查,並將接觸數據與其他國家和地區的接觸數據進行了比較。此外,我們調查了不同的問卷媒介和記錄參與者的行為對報告的接觸模式的影響。

結果

報告接觸情況及問卷調查模式的效果

我們在香港進行了一項基於人群的社會接觸調查,使用參與者完成的日記,類似於Mossong在歐洲POLYMOD研究中使用的日記4.我們定義了15個年齡組,並按年齡和性別應用配額抽樣。18歲以下的兒童和青少年被過度采樣,因為他們被認為是許多呼吸道傳染病傳播的主要驅動力(表2)1).為方便招募及鼓勵參與者參與,我們根據POLYMOD研究的樣本問卷,製作了一份內容相同的紙質及電子在線問卷,並邀請參與者選擇他們更熟悉的問卷模式(補充文本)S1).

表1按參與者性別、年齡、星期幾、家庭人口、教育程度、收入水平和問卷方式劃分的報告接觸人數和接觸總小時數的平均值。

我們記錄了來自557名男性受訪者和592名女性受訪者的7960名聯係人(表2)1).日均報告接觸人數為6.93人(95%可信區間6.56 ~ 7.32),低於日本9以及歐洲大多數國家4但與德國(平均7.95人)相當。4越南(平均7.7人)15.接觸者數量的分布高度右傾,有13名(1.1%)參與者報告每天接觸者超過30人(圖2)。1).我們發現,在Kruskal-Wallis檢驗中,參與者年齡、家庭規模、教育程度、收入水平和問卷方式與報告的接觸人數顯著相關。使用紙質問卷的參與者報告平均每天有9.99個聯係人(95% CI 9.24-10.8),這遠遠高於使用電子在線問卷的參與者,後者平均每天隻有5.10個聯係人(95% CI 4.78-5.45)。差異有統計學意義(Mann-Whitney U檢驗,p < 0.01)。傾向評分分析考慮問卷方式後,平均接觸次數為8.14 (95% CI: 7.11 ~ 9.31),平均接觸時間為12.77 h (95% CI: 11.19 ~ 14.35)。按參與者特征劃分的總接觸時間分布與報告的接觸次數相似(表2)1).

圖1
圖1

報告的接觸人數和總接觸時間的分布情況。

然而,在我們的樣本中,問卷的方式與參與者的年齡、教育程度和收入水平密切相關,因此其對報告的接觸人數和接觸時間的影響可能是混淆的(表2).在中介分析中,在考慮其他參與者特征後,發現紙質問卷中報告的聯係人數量顯著高於在線問卷(表2及補充表S2).報告接觸者的相對人數為2.32人(95%可信區間2.26-2.38)。

表2調查參與者的不同特征所報告的相對接觸人數和每個參與者每天的相對接觸總小時數。

報告的接觸人數和總接觸時間隨著年齡的增加而減少,但隨著家庭規模、教育程度和收入水平的增加而增加2).隨著年齡的增長,接觸時間的下降比報告的接觸人數的下降更為明顯。與歐洲和日本的數據相比,我們發現工作日和周末接觸的差異與年齡有關(補充表)S549.負二項回歸模型的過離散度參數顯著大於零,表明該模型比泊鬆回歸模型更合適。盡管確定的潛在參與者數量較少(詳見方法),但在前瞻性和回顧性填寫的在線問卷中報告的接觸人數存在統計學上的顯著差異(補充表)S4).

接觸的性質、持續時間、地點和頻率

我們的研究結果表明,參與者報告的大多數聯係都是與他們的家庭、學校和工作聯係人進行的(圖2)。2).盡管使用在線問卷的參與者報告的接觸人數少於使用紙質問卷的參與者,但我們發現在線參與者報告的與家庭成員接觸的比例更高。這表明,與家庭成員的接觸不太可能被排除在外。

圖2
圖2

參與者和他們的聯係人之間的關係。參與者可以從以下類別中選擇一種來報告他們與聯係人的關係:家庭成員、同學或同學、工作夥伴、其他人和不認識的人。(一個)所有參與者。(b)參與者使用紙質問卷。(c)參與者使用在線問卷。

我們用多種方式測量了接觸的強度,包括持續時間、地點、頻率以及是否涉及身體接觸。家庭接觸、長時間接觸和日常頻率接觸更可能涉及身體接觸(圖。3.).家庭接觸最有可能(60%)涉及身體接觸,其次是學校和工作場所的接觸。在多個地點的大多數接觸涉及身體接觸,可能是因為其中大多數涉及在家裏或學校的接觸。同樣,超過一小時的接觸中約50%涉及身體接觸。超過40%的日常接觸涉及身體接觸,但相比之下,初次接觸的個人隻有15%涉及身體接觸。

圖3
圖3

物理接觸占比和持續時間。身體接觸或非身體接觸的比例和接觸時長(以人小時計)一個b)持續時間,(cd)地點,及(ef)聯絡次數。

接觸時間、位置和頻率似乎相互關聯(圖2)。4).近70%的家庭接觸時間超過1小時,其次是學校(~50%)和工作場所(~40%)。約60%的每日接觸時間超過1小時,70%的初次接觸時間少於15分鍾。超過80%的家庭接觸是日常接觸,其次是學校接觸(>60%)和工作場所接觸(~60%)。

圖4
圖4

接觸時間、位置和頻率之間的相關性。之間的相關性(一個)期間及地點,(b)期間及頻率,及(cd)聯絡地點及頻率。

與年齡相關的社會混合模式

數據5而且6(補充表S6a-d)顯示每位參與者報告的與不同年齡組的人每天的平均聯係號碼和持續時間。接觸矩陣最明顯的特征是最高強度對角線,表現出年齡-分類混合模式,即個體傾向於與其他年齡相似的個體有更多的接觸。年齡選型在5-20歲的學齡兒童中最為明顯,在65歲以上的老年人中最不明顯。從參與者和接觸者的30-35歲開始,兩條平行的次要對角線偏移到中心對角線,顯示在所有年齡組中,與父母或子女接觸的參與者之間的接觸強度增加。從30-35歲接觸者開始,二次對角線較為明顯。對於工作年齡的成年人,無論是參與者還是涉及工作場所接觸的接觸,在25-60歲之間都存在廣泛的接觸強度平台期。我們在2009年用於流感大流行的年齡分層流感傳播模型中,探索了不同社會接觸數據在估計流感感染發作率方麵的潛在影響26,並發現該差異並沒有在模型估計中產生實質性差異(補充資料)。

圖5
圖5

報告接觸者的接觸矩陣,包括每個參與者每天的平均接觸人數和平均接觸時間。(一個- - - - - -d)所有報告的接觸者;(e- - - - - -h)紙質問卷中報告的聯係人;(- - - - - -l)通過在線問卷報告聯係人;(- - - - - -p)采用反概率治療加權(IPTW)對報告接觸者進行加權,使用傾向評分對問卷模式進行加權。原始接觸矩陣{cij}表示該年齡組的平均聯係人數或平均聯係人小時數由不同年齡組的參與者報告j;計算了對稱接觸矩陣\ (\ {\ widehat {{c} _ {ij}} \} = \壓裂{{c} _ {ij} + {c} _{他}}{2}\)

圖6
圖6

光滑的接觸矩陣的所有報告接觸和總接觸持續時間。光滑接觸矩陣基於所有接觸數據,使用高斯核的核密度估計構造:(一個)原始報告接觸者人數(b)對稱的報告接觸數,(c)原始聯係人時間及(d)對稱的聯係人時間。原始接觸矩陣{cij}表示該年齡組的平均聯係人數或平均聯係人小時數由不同年齡組的參與者報告j;計算了對稱接觸矩陣\ (\ {\ widehat {{c} _ {ij}} \} = \壓裂{{c} _ {ij} + {c} _{他}}{2}\).應用反概率處理加權(IPTW)與傾向評分的調查模式。在MATLAB 9.0中對帶寬進行默認優化,以估計正態密度,並通過簡單的數據反射來校正邊界偏差。

討論

采用與大型歐洲接觸調查相似的方法4,我們研究了香港的社會接觸情況,並量化了接觸者的混合模式。總體而言,我們記錄的平均每名參與者每天接觸8.1人,遠低於歐洲數據中的13.4人,以及之前香港接觸調查的18.0人13(補充表S1).使用紙質問卷的參與者報告的接觸人數和接觸時間明顯多於使用在線問卷的參與者,問卷的選擇與年齡、教育程度和收入水平密切相關(表2)1).與歐洲的數據相似,我們發現在接觸次數和總接觸時間上有顯著的過度分散,在特定年齡的接觸矩陣中有明顯的選型。

報告的接觸人數和報告的接觸持續時間的分布都是高度向右傾斜的,但後者的分布有一個更重的右尾(圖2)。1).在之前的接觸調查中,兩種分布的差異在允許參與者包括“群體接觸”的調查中更為明顯。611.然而,對於呼吸道感染,缺乏經驗數據來驗證易感者和感染者之間的接觸傳播感染的可能性與接觸的物理性質和持續時間之間的關係3.

我們發現,在傾向得分分析中調整問卷模式後,受教育年限越長、收入水平越高的參與者更有可能選擇在線問卷,並報告更多的聯係人。這一發現與人口普查統計數據中的時間使用數據一致34,顯示受教育年限越長、收入水平越高的人花在社交和休閑活動上的時間越多,而受教育程度越低、收入水平越低的人花在家庭責任上的時間越多。與歐洲和日本的數據相比,我們發現工作日和周末接觸的差異與年齡有關(補充表S5).據報告,18歲以下的兒童和青少年在周末與學校的接觸比平日多,這可能是由於香港的學校製度,學生在周末與同學一起參加許多課外活動,特別是在周六。對於18歲至50歲的成年人來說,工作接觸沒有顯著減少,而輕微的(不顯著的)減少部分被家庭、學校或工作以外的人在周末接觸的增加所彌補。對於50歲以上的老年人,這種模式與其他接觸調查一致,觀察到所有接觸類型都有所減少。考慮到在我們的研究中報告的聯係人數量相對較少,工作日報告的聯係人數量較少可能部分源於回憶偏差,因為短期聯係人和工作聯係人更有可能被報告為遺忘3.

接觸強度在20歲以下的學齡兒童中最高,並隨著年齡的增長而下降。參與者更有可能聯係他們的家庭成員、同學和同事。同樣,長時間和頻繁的接觸,以及在家裏、學校和工作中的接觸更有可能涉及身體接觸。最強的年齡選型被發現在學齡兒童和青少年(圖5而且6).我們還發現了另一個在41歲至65歲的成年人中接觸強度較高的強區域,這也在越南觀察到15但在日本和歐洲的數據中並不存在49.但是,在對問卷模式的傾向得分進行加權後,該年齡組的接觸強度有所降低,這可能是由於該年齡組紙質問卷的使用率較高所致。

從紙質問卷和在線問卷中獲得的數據的比較並不是我們最初研究設計的一部分。之所以進行這種事後分析,是因為在兩種模式之間報告的接觸數量中觀察到明顯的差異。盡管如此,我們的研究是為數不多的接觸調查之一,以調查所有年齡組中使用紙質問卷和在線問卷的決定因素和結果126.在我們的研究中,在線問卷的選擇與年齡、教育程度和收入水平顯著相關,這與問卷混合管理的研究結果一致35.與之前的接觸調查相比126在我們的研究中,即使考慮了參與者的特征,使用紙質問卷的參與者報告的接觸人數和接觸時間也比在線問卷高。紙質問卷和在線問卷的唯一區別是聯係日記的格式:在紙質問卷中,我們在一本小冊子中提供了100個空白的聯係記錄;在在線問卷中,聯係人日記是一個動態表格,參與者可以在點擊“添加聯係人”按鈕時添加一個條目。

目前尚不清楚在線問卷的形式是否阻礙了參與者填寫他們的聯係方式。直接比較紙質調查和在線接觸調查的文獻有限。在Beutels進行的調查中.和McCaw,參與者被要求同時使用紙質問卷和在線問卷1或者連續兩周2.McCaw.在65名成年參與者的小型社會接觸調查中進行了問卷模式的比較,發現使用紙質問卷的確定優於使用pda交付的在線問卷2.在英國和日本的兩項大規模人口接觸調查中,很難比較紙質問卷和在線問卷:在日本的研究中9,隻有那些65歲以上且沒有與年輕家庭成員生活在一起的人使用了紙質問卷;在英國的研究中6,兩種模式的招募方式不同,紙質問卷隨機發放到隨機選擇的家庭,任何有興趣參與的人都可以獲得在線問卷。鑒於在線數據收集工具的使用迅速增長,在未來的接觸性調查研究中應考慮對問卷設計和管理進行更多的調查。

我們通過評估參與者填寫每個聯係人條目的實際時間來分析前瞻性和回顧性完成的效果。我們發現,95%以上的參與者可能會回顧性地完成問卷,盡管我們鼓勵他們提前完成問卷。盡管潛在參與者數量有限,但我們發現在潛在參與者中報告了更多的接觸,並且在線問卷調查的效果具有統計學意義(補充表)S4).在我們的調查中,報告的接觸的總體平均數量較低,這可能反映了參與者回顧行為所帶來的回憶偏差。雖然我們所能做的分析受到少量前瞻性填寫問卷的限製,但如果未來的接觸調查包含記錄時間的信息,則可以在前瞻性調查和回顧性調查之間進行更多的比較。隨著智能手機和可穿戴設備的使用越來越多,未來的社會接觸調查可能還會考慮使用這些設備在指定的日子裏或在參與者的位置發生變化(如從家到學校或從工作到休閑)時發送幾次提醒,從而最大限度地減少對參與者記憶的依賴,以回顧性地記錄接觸事件。

在社會接觸調查中使用的各種方法之間的異質性使得很難直接比較從不同人群獲得的接觸數據(補充表S1).在亞洲進行的調查中,問卷是由日本的參與者、之前香港調查的采訪者以及越南、廣東和台灣等其他地區的采訪者完成的。之前的香港研究和廣東研究要求參與者考慮“群體接觸”,這可能會增加報告的接觸人數1113.與其他社會接觸調查不同的是,日本研究的參與者是從調查公司定期維護的參與者庫中招募的,並且在線問卷分發給大多數已經熟悉不同在線問卷設計的參與者9.在台灣的研究中沒有接觸矩陣14並且不能從之前的香港研究中構建定製的年齡組1213.如果網上有更詳細的聯係數據文檔,不同的社會接觸調查之間可以進行更多的比較。

總之,我們評估了與香港呼吸道傳染病傳播相關的社會接觸和混合模式的特征。我們的數據為改善香港傳染病傳播數學模型的參數化提供了重要信息,特別是通過密切接觸的呼吸道感染,如水痘、呼吸道合胞病毒和流感。我們的發現可以幫助改進未來社會接觸調查的設計,並根據建模研究的結果為幹預策略提供信息。

方法

調查方法

參與者是通過隨機數字撥號所有固定固定的住宅電話線路招募的。每個電話號碼最多撥5次,直到有人應答為止。在成功接通電話後,我們向受訪者簡要介紹了本研究。然後被調查者被問及他/她的家庭組成。我們從符合年齡和性別指標的人群中隨機選擇了一名符合條件的家庭成員,並邀請他們參加我們的研究。招聘繼續進行,直到我們達到按年齡和性別劃分的預定目標尺寸。

針對不同年齡的參與者提供了三種類型的問卷:0 ~ 10歲的父母代理兒童問卷,11 ~ 17歲的青少年自我報告問卷,18歲及以上的成人自我報告問卷。我們采用了與POLYMOD研究相同的接觸定義4接觸的定義是肌膚接觸,如握手(身體接觸),或在參與者和被接觸者都在場的情況下,在兩米內進行三個或三個以上單詞的麵對麵交談。參與者被要求為在指定日期的早上5點到第二天早上5點之間聯係的每個人填寫一份記錄,無論與此人聯係過多少次。獲得了關於每一次接觸的年齡和性別、接觸的持續時間和地點、是否涉及身體接觸以及參與者與接觸者見麵的頻率等信息。通過指示,參與者被鼓勵前瞻性地(在他們結束每次聯係時)填寫問卷中的每一次聯係,而不是回顧性地(在一天結束時)。與其他基於日記的問卷調查一樣,我們無法確保他們真的這麼做了。然而,我們有參與者填寫的實際時間的信息,或者通過保存計算機時間記錄(在在線問卷係統中),或者通過要求參與者手動記錄他們填寫每個聯係人的時間(在紙質問卷中)。在這兩種情況下,如果問卷中第一次和最後一次接觸的時間相差不到一個小時,我們將參與者分為回顧性填寫問卷的參與者和前瞻性填寫問卷的參與者。時間相差超過24小時的參與者和隻記錄過一次接觸的參與者不包括在前瞻性和回顧性問卷的比較中。

統計分析

我們使用非參數Kruskal-Wallis檢驗評估了參與者特征(即性別、年齡、星期幾、家庭規模、教育程度、收入水平和問卷方式)對報告接觸人數的影響。通過中介分析,我們發現問卷調查模式在參與者特征與報告接觸人數之間的因果關係中起中介作用(補充表)S236.在中介分析中,我們遵循了David A. Kenny描述的步驟1-336如下:

  1. 1.

    我們發現,在負二項多元回歸模型中,報告的接觸人數與參與者的性別、年齡、星期幾、家庭規模、教育程度和收入水平相關。

  2. 2.

    在logistic回歸模型中,我們發現問卷模式的選擇與參與者的性別、年齡、星期幾、家庭規模、教育程度和收入水平相關。

  3. 3.

    我們發現報告的接觸人數與問卷模式的選擇、年齡、性別、星期幾、家庭規模、教育程度和收入水平有關。

在此基礎上,我們運用傾向評分分析來減少問卷媒介選擇模式的潛在影響37.在上述步驟2所示的邏輯回歸模型中,估計每個參與者選擇紙質問卷的傾向(補充圖)S1).我們通過使用R 3.3.3中的“MatchIt”包來匹配生成的傾向分數,從而創建了一個合成樣本38.在匹配的樣本中,我們通過計算紙質和在線問卷組的人口統計學變量的標準化差異來比較受試者(補充表)S3).

對於原始樣本和合成樣本,我們采用加權多變量負二項回歸模型評估協變量(即性別、年齡、星期幾、家庭規模、教育程度、收入水平和問卷方式)對報告接觸人數和總接觸時長(以人小時計)的影響。每個接觸事件的持續時間分為四個類別之一,因此我們將接觸持續時間指定為相應類別的中點,以4小時為右截尾。然後計算每個參與者的總接觸時間。抽樣權重是根據2015年香港人口普查的年齡分布計算的。我們沒有考慮住戶人數的分布情況,因為我們無法獲得按年齡劃分的住戶人數的普查統計數字。在敏感性分析中,我們將負二項回歸模型與加權多變量泊鬆回歸模型進行了比較,發現負二項回歸模型具有較低的AIC。使用高斯核的二元核密度估計來平滑特定年齡的接觸矩陣。平滑采用反概率處理加權法(IPTW),傾向分數為問卷模式。在MATLAB 9.0中優化帶寬以估計法向密度。利用接觸數據的簡單反射修正了邊界偏差39

倫理批準

這項研究已獲香港大學/醫院管理局香港西聯網院校檢討委員會(HKU/HA HKW IRB)批準。參考編號是UW 14-537。所有的方法都是按照相關的指南和規定進行的。獲得所有參與者和/或其法定監護人的知情同意。

數據可用性

作為本次調查的一部分,收集的數據將通過zenodo數據庫提供給科學界,作為社會聯係數據收集計劃的一部分www.socialcontactdata.org感謝ERC授予Niel Hens(哈塞爾特大學和安特衛普大學)TransMID(資助協議682540)。