條文本

代表性和最優使用身體質量指數(BMI)在英國臨床實踐研究數據鏈接(CPRD)
  1. Krishnan Bhaskaran,
  2. 哈麗雅特·J福布斯,
  3. 伊恩•道格拉斯,
  4. 大衛利昂,
  5. 利亞姆Smeeth
  1. 教員的流行病學與人類健康倫敦衛生和熱帶醫學學院的,倫敦、英國
  1. 對應到Krishnan Bhaskaran博士;krishnan.bhaskaran在{}lshtm.ac.uk

文摘

目標評估的完整性和代表性的身體質量指數(BMI)臨床實踐研究中的數據數據鏈接(CPRD),並確定一個最優策略的使用。

設計描述性研究。

設置從初級保健電子醫療記錄。

參與者來自英國的一百萬名患者隨機樣本CPRD初級保健數據庫,年齡≥16年。

主要和次要結果的措施BMI在CPRD完整性評估了年齡、性別和日曆。BMI CPRD-based總結統計每個日曆年(2003 - 2010)是年齡標準化的和sex-standardised並與等效來自英格蘭的健康調查數據(HSE)。

結果BMI完整性增加日曆時間從1990年的37%,1994年到2005 - 2011年的77%,高於女性,隨著年齡的增加。當BMI在特定時間點被分配根據最近的記錄,calendar-year-specific平均BMI等效HSE統計數據低估了0.75 - -1.1公斤/米2。限製那些最近(≤3年)BMI導致平均BMI估計接近HSE(≤0.28公斤/米2低估),但排除了多達47%的病人。基於模仿另外一個策略將最新的BMI指數的變化隨著時間的推移,自從上次記錄也導致可用的意思是BMI估計接近HSE(≤0.37公斤/米2低估)。

結論完整性CPRD BMI的增加隨著時間的推移,不同的年齡和性別。在給定的時間點,大部分最近的BMI指數不可能反映目前的體重指數;順向BMI誤分類可能減少使用基於模型的當前BMI的歸責。

  • 流行病學
  • 初級護理
  • 統計數據和研究方法

這是一個開放的分布式條依照創作共用署名非商業性(3.0 CC通過數控)許可證,允許別人分發,混音,適應,建立這個工作非商業化,和其派生作品在不同的條款進行許可,提供了最初的工作是正確地引用和非商業使用。看到的:http://creativecommons.org/licenses/by-nc/3.0/

來自Altmetric.com的統計

請求的權限

如果你想重用任何或所有本文的請使用下麵的鏈接,這將帶你到版權稅計算中心的RightsLink服務。你將能夠獲得快速的價格和即時允許重用內容在許多不同的方式。

文章總結

本研究的優點和局限性

  • 這裏給出的結果是基於一個大型隨機樣本從臨床實踐研究數據鏈接(CPRD);因此,我們可以自信地歸納研究結果對整個CPRD數據庫和類似數據庫基於英國初級護理記錄。

  • 評估CPRD身體質量指數(BMI)的代表性數據,我們與英國健康調查的數據相比,基於一個大型全國代表性樣本,包括體重指數來衡量培訓麵試官的信息。

  • 我們的研究沒有觀察BMI兒童錄音這將需要不同的策略。

介紹

超重和肥胖是全球疾病負擔的主要貢獻者1並與大量的超額死亡率相關。2肥胖的發病率正在增加在發達國家和發展中國家3,4給政策製定者和越來越多的關注。在英國,肥胖的流行率穩步上升,從1993年到2010年:從13 - 26%的男性,從16 - 26%的女性。5由於其與各種疾病和健康狀況,身體質量指數(BMI,度量最廣泛使用的分類超重和肥胖)是一個重要的因素在許多流行病學研究,既是曝光和作為一個潛在的糊塗。

定期收集電子醫療記錄的數據庫變得越來越寶貴的資源在流行病學、允許群體大,研究具有代表性的樣本。英國臨床實踐研究數據鏈接(CPRD)(以前慣例研究數據庫或大)被廣泛使用,包含綜合醫療記錄對大約8%的英國人,6允許進行流行病學研究的主題和統計力量比通常可用在傳統的隊列研究。然而,這些數據庫的缺點是生活方式的數據,如BMI、伺機往往是記錄(即記錄當病人參加其他原因或物質的直接臨床重要性),可以不完整。此外,那些non-missing生活方式的數據可能是普通人群的代表性。體重指數是一個重要的協變量基於CPRD發表了許多研究,7 - 14但BMI的完整性和代表性的數據沒有被記錄。

我們的目的是進行深入調查,BMI CPRD錄音,包括量化指數數據的完整性,並評估他們的代表性比較基於CPRD數據彙總統計和代表普通人群調查統計。我們還旨在建議和討論如何處理這些BMI定期收集數據的局限性。

方法

數據源

臨床研究數據鏈接(CPRD

CPRD臨床數據庫包含匿名計算機化的醫療記錄從全科醫生(GPs)在英國。大約8%的英國人口目前包括和數據庫是具有廣泛代表性的英國人。15,16注冊醫生是幾乎所有在英國,17把關和GPs作為衛生係統,以便CPRD數據形成一個全麵的醫療記錄,包括人口統計信息、臨床相關的生活方式的數據,處方細節,臨床事件,提供預防保健,專家推薦和住院及其主要結果。數據進行質量檢查和實踐是指定為“合格”CPRD從指定的日期,他們滿足數據輸入質量標準。在這項研究中,我們獲得一個隨機抽取的一百萬名CPRD病人,因為完整的CPRD數據庫進行分析是計算困難,我們估計的精度下降會產生一千一百萬個隨機樣本通過限製我們的分析是非常小的。

在CPRD BMI指數數據

身高和體重測量記錄在CPRD每當測量作為日常保健的一部分。我們獲得所有身高和體重記錄和計算體重指數(BMI =體重/身高2)。記錄沒有任何測量或難以置信的測量被排除在外(圖1)。

圖1

初始數據處理來生成身體質量指數進行分析。

健康調查為英格蘭

我們獲得健康調查的英國出版(HSE)數據的BMI國民健康服務(NHS)信息中心。18HSE的年度調查是為了產生一個代表性樣本的成年人口年齡≥16歲,住在私人家庭(樣本大小14 836年2010年2003年和8420年)。調查與麵試官管理測量所有參與者的體重和身高。數據得到了從2003年到2010年,這些數據加權,以減少偏見的情況說明,基於邏輯回歸模型將年齡、性別、家庭類型(基於成人和兒童生活在一個家庭的數量),戰略地區衛生行政部門和社會階層使用國家統計局社會經濟分類係統(定義)。詳細描述的方法。19

統計方法

BMI CPRD數據的完整性

主要分析、BMI CPRD完整性數據估計了日曆時期(1990 - 1994,1995 - 1999,2000 - 2004,2005 - 2011)。計算完整性為特定日曆期間,所有個人注冊的一百萬名樣本,年齡≥16年,在“標準”後續實踐期間的中點是識別和包含在分母。這些個體之間,分子由那些以往BMI在他們的電子記錄無論多久以前進入或那些體重指數可用此日期之前3年。完整性數據生成的年齡段、性別和那些為誰,臨床原因,BMI應定期監測(2型糖尿病患者,精神分裂症和其他精神病和≥2近期(6個月)他汀類藥物的處方)。我們也調查了完整性是否可以改善通過搜索臨床規範(“讀碼”)表明體重指數類別。我們沒有了獨聯體為這些描述性統計因為樣本量抽樣誤差可以忽略不計(例如,SEs比例與年齡和完整的身體質量指數數據生效子組均< 0.5%)。

比較CPRD BMI與HSE數據數據

我們比較平均BMI /日曆時間基於完整的HSE CPRD BMI數據和相關數據,對2003 - 2010年期間(從2003年起,HSE數據調整的情況說明)。CPRD意味著BMI是基於病人注冊並在標準的後續生效的中點。我們生產兩套CPRD平均BMI統計:首先,我們使用最後BMI觀察結轉(無論多久以前記錄);第二,我們限製我們的研究最近的患者體重指數可用(最多3年之前曆年的中點)。如上所述,獨聯體不了,因為是微不足道的抽樣誤差(最大SE = 0.02公斤/米2)。與HSE和比較,CPRD數據僅限於英語實踐(僅供與HSE數據比較),和平均體重指數年齡標準化的和sex-standardised HSE人口結構。比例分為肥胖(體重指數≥30公斤/米2)隨著時間的推移和基於CPRD和HSE數據也比較。

基於模型的歸責CPRD最新的BMI的措施

我們探索是否過時CPRD BMI措施可以有效地更新歸罪基於模型預測個體層麵的體重指數隨時間的變化。我們使用數據從個體與多個BMI記錄模型預期的變化在體重指數BMI記錄以來作為時間的函數(限製與BMI個人記錄≤10年除外)。我們安裝一個線性回歸模型與體重指數變化的結果;主協變量預測體重指數運行時間的變化,這是作為一個三結三次樣條允許非線性;我們還包括樣條基變量和指標變量之間的相互作用對年齡和性別。可行的加權最小二乘估計是用來允許異方差性。20.

在BMI指定模型改變隨著時間的推移,我們首先探討其性能與至少兩個BMI指數進入個體CPRD,通過預測最近體重指數基於前麵的BMI記錄和運行時間;我們比較錯誤的分布與錯誤的分布從這種方法通過使用過去觀察發揚光大。然後我們反複比較與HSE意味著每個日曆年度指數數據。這次,我們包括所有個人體重指數為記錄在前10年,使用上述模型推導出當前BMI在曆年的中點預測的變化可用體重指數BMI自上次記錄。我們在多個歸責框架(使用五個罪名)占建模的不確定性會隨著時間而改變。21

結果

BMI CPRD數據的完整性

在1990 - 1994年,37%的人至少有一個先前記錄的BMI,和2005 - 2011的比例增加到77% (表1)。The proportion of individuals with a recent BMI (recorded in the previous 3 years) was lower in each calendar-period (35% in 1990–1994 rising to 51% in 2005–2011). BMI completeness generally increased with age up to 75 years, with a lower proportion in the oldest age group having data available. Data for single calendar years are shown in online補充附錄表A1和說明相似的模式。身體質量指數數據似乎一直廣泛可用的女性比男性(圖2)。正如所料,BMI完整性較高特別是臨床亞組:總的來說,97%的創紀錄的II型糖尿病患者有一個最近的BMI記錄,以及超過78%的精神分裂症/精神疾病的診斷(見在線補充附錄表A2)。這是符合質量和結果框架(QOF),這鼓勵了BMI監測自2004年以來,這些條件。22高BMI完整性也在當前他汀類藥物與最近的可用BMI (82%)。

表1

BMI CPRD中數據的完整性,通過年齡和日曆

圖2

身體質量指數數據的完整性在臨床實踐中研究數據鏈接,通過性別和日曆期間。

幾乎沒有額外的信息在臨床(“讀”)與體重指數相關的代碼。75年最新的日曆期間,518人沒有以前的BMI記錄可用,隻有1222人(1.6%)有過臨床的代碼將使分類為BMI類別(體重過輕,普通體重,超重/肥胖)。此外,對於那些以前的BMI,隻有一小部分最近的BMI相關信息記錄在一個臨床代碼在最近時期(7675/250 430 = 3.0%)。

摘要統計信息使用完整CPRD BMI與HSE數據和比較

我們發現年齡標準化的BMI和sex-standardised意味著基於CPRD數據一致,大大降低(1.1公斤/米2比HSE)數據(平均BMI CPRD = 25.7公斤/米22003年上升到2010年的26.3,26.8公斤/ m2(95% CI 26.7 - 26.9)和27.3(27.1 - 27.5),分別在HSE;圖3)。

圖3

意思是身體質量指數(BMI)在日曆時間比較那些體重指數記錄在臨床實踐研究與健康調查數據鏈(英語實踐)英格蘭2010年的數據。

BMI條目超過3歲時被丟棄,33 - 47%的患者在生效。然而,估計平均BMI在CPRD相當接近預期的HSE數據的基礎上,與CPRD數據低估了HSE統計隻有0.04到0.28公斤/米2個人生效和CPRD估計下降在HSE CI的兩個最近3年內(平均BMI CPRD = 26.9、27.0和27.0公斤/米2與27.0(26.9 - 27.1),27.0(26.8 - 27.2)和27.3(27.1 - 27.5)在HSE,分別於2008年、2009年和2010年)。Age-stratified和sex-stratified數據展示了類似的模式,除了老大年齡組(75年以上),限製那些最近BMI措施沒有帶估計體重指數大大接近了HSE數據(請參見圖A1在線補充附錄)。

我們也比較了比例列為肥胖CPRD與HSE(見在線補充附錄圖A2)。與前麵的分析一致,使用任何先前的BMI閱讀分類個人CPRD導致肥胖率低於預期根據HSE數據,同時限製患者最近閱讀導致HSE估計肥胖率接近。

基於模型的歸責CPRD最新的BMI的措施

BMI的對比總結統計基於最近的措施和基於以往任何措施建議老當前體重指數BMI記錄都傾向於低估。因此,我們檢查是否可以開發一個模型歸咎於當前的BMI,考慮自上次測量的時間。在線性回歸模型中體重指數的變化隨著時間的推移,我們估計,平均BMI增加BMI後10年期間記錄的69歲時的記錄和減少隨時間在那些70歲或更多(見在線補充附錄圖A3)。我們測試了我們的模型的預測性能預測基於上一個最近的BMI,患者CPRD BMI與多個記錄。當時老BMI是不到3歲,幾乎沒有獲得相比,應用修正帶著年長的觀察(圖4)。然而,當有時間差距,攜帶前BMI向前傾向於低估了後來BMI,而采用基於模型的歸責被低估,導致小錯誤平均(平均誤差=−0.70公斤/米2(差−2.18 + 0.56)使用過去的觀察結轉,相比之下,+ 0.11公斤/米2(−1.29 + 1.40)使用基於模型的歸責)。

圖4

錯誤預測最近從年長的BMI指數,比較簡單的持續觀察結轉和基於模型的歸責的最新BMI-stratified讀數之間的時間差距。

然後重複意味著在CPRD BMI與HSE的比較,這一次使用我們的模型體重指數隨時間變化為基礎執行多個罪名當前BMI基於最新的測量和記錄以來的時間。估計平均bmi指數是現在隻與那些基於最近的數據在前麵的分析中,隻有0.04到0.37公斤/米2低於HSE統計個人日曆年(圖3、圓)。即使有多個歸罪,獨聯體仍極窄(< 0.07公斤/米2)由於樣本量大,因此在圖中沒有顯示。值得注意的是,所有患者BMI記錄10年前的中點現在感興趣的是包含在年度評估的“糾正”的意思是;因此,在個人日曆年,隻有9 - 13%的患者下降,而下降時33 - 47%的患者體重指數記錄> 3歲。

討論

主要發現

BMI完整性增加日曆時間(從1990 - 1994年的37%上升到77%在2005 - 2011年)。完整性是高於女性,年齡更大的年齡組和臨床亞組記錄BMI的鼓勵。BMI在感興趣的日期被分配到單個病人CPRD使用記錄,最後無論多久以前進入,我們發現產生的平均BMI CPRD人口的統計數據都低於相當於HSE估計(1.1公斤/米2)。這似乎是由舊係統傾向於低估當前體重指數BMI記錄:當隻有最近CPRD BMI記錄(≤3歲)被使用,平均BMI統計數據更接近HSE的估計。然而,大量的病人完全被排除在年)(33 - 47%。最後,我們提出了一個過程模型在體重指數BMI變化記錄,可以讓研究人員歸咎於BMI在利益和避免大量的日期沒有最近的測量分析。

與其他研究相比

很少有類似的研究(見在線補充附錄表A2)。然而,患者的比例最近CPRD BMI記錄符合QRESEARCH數據庫的摘要(類似英國初級護理教育管理信息係統數據庫數據來自530多個通用實踐使用軟件而不是視覺軟件)23;注冊到2007年3月,58%的16歲以上患者的BMI記錄在過去的5年;相比之下,有51%的體重指數為記錄在過去的3年我們的分析(2005 - 2011)。類似於我們的研究中,QRESEARCH報告顯示完整性的增加隨著時間的推移,從2000/2001的42%上升到2007年的58%。在第三個英國初級保健數據庫,改善健康網絡(薄),新登記的病人的比例在2004年和2006年之間與BMI數據符合我們的發現;62%的患者有高度記錄和66%的體重記錄在12個月內登記。24

解釋研究結果

完整性

隨著時間的推移增加BMI的完整性可能反映了一個普遍的趨勢鼓勵BMI在初級保健記錄。更大的BMI完整性女性和老年群體中可能有多種解釋包括在初級保健谘詢利率上升25,26和不同數據大相徑庭的疾病監測BMI是很重要的。

比較CPRD BMI與HSE數據數據

基於CPRD人口的平均BMI低於每個日曆年相當於HSE估計BMI在CPRD被分配使用可用的最後記錄;然而,當分析僅限於那些最近BMI記錄,估計從CPRD接近HSE的估計。這表明,BMI錄音的大部分CPRD過時的日期可能是因為研究的興趣明顯低估意味著BMI在CPRD無限製的分析。反過來,這可能意味著個人BMI指數增加隨著時間的推移,確實,當我們專門模仿BMI變化隨著時間的推移,我們發現一個模式增加BMI與年齡< 70歲,符合前瞻性群組研究BMI與重複測量-;這種模式隨著時間的推移增加BMI可能是驅動的具體重量變化,自從成年身高不會大幅改變在這個年齡段。一個簡單的調整過時的BMI指數基於我們模仿變化隨著時間的推移把CPRD意味著BMI統計符合HSE估計,當我們驗證調整患者的一個子集BMI重複測量,我們發現小錯誤平均而言,相比之下,隻是帶著過時的BMI記錄轉發。

值得注意的是,我們觀察到CPRD都低估了BMI與HSE≥75歲的人中,即使隻使用最近的記錄;這可能反映了一個事實,製度化CPRD但不是在HSE患者表示:HSE可能不是一個理想的比較以來這個年齡段老年人機構(在CPRD代表)更有可能是虛弱和bmi指數低於那些生活在私人家庭。

影響

首先,我們的研究結果表明,不同研究BMI完整性可能取決於研究人口和研究期間。BMI數據不可能缺少完全隨機(如missingness由病人特征或特殊疾病可能會有所不同)。可能存在數據庫中的信息,然而,預測missingness並可以滿足所需的“隨機缺失”的假設多個歸責。研究探索的潛力將丟失的數據在薄發現多個歸責後,彙總統計的身高和體重都比得上來自全國代表性數據集的數據。24

第二,我們的分析表明,分配的共同實踐BMI狀態基於最近的/最近可用的記錄感興趣的索引日期可能導致誤分類,考慮到大量的病人隻有大大過時的BMI記錄可用在任何特定時間。解決這個策略包括限製最近的體重指數,但這可能會排除大量的病人。我們提出另外一個策略基於更新過時的BMI指數BMI的造型變化隨著時間的推移,盡管這並非沒有缺點:該方法需要一個假設:個人與BMI≥2記錄可用(需要估計模型隨時間變化)是代表廣大的患者,這可能並非如此;也是一個更複雜的策略,尤其是在執行多個歸責框架允許調整的不確定性,這可能是實質性的研究樣本量較小,比被認為是在這裏。其他歸責策略也可以認為是在某些情況下,如2倍算法,從縱向背景缺失的數據變量在特定時間點通過相鄰數據點。30.最終,各種方法的利弊,以及要使用的最佳策略,可能會依賴於特定的學習和研究人群的特點。

優勢和局限性

這裏給出的結果是基於一個大從CPRD隨機樣本;因此,我們可以自信地歸納研究結果對整個CPRD數據庫。雖然我們不能假設這些發現將與英國定期收集初級保健數據庫基於其他IT係統(CPRD基於實踐使用視覺),底層過程駕駛BMI記錄可能是相似的。這項研究沒有觀察BMI兒童錄音,因為這將需要不同的策略。完整性在16 - 24歲組可能被人為壓低,因為重量記錄年齡< 16被排除在外,所以這些低端的年齡不會有盡可能多的時間積累的體重記錄。我們認為HSE的最好的比較研究;全國代表性,大樣本利用身高和體重記錄由一個訓練有素的官和情況進行加權。19,31日然而,有一定程度的HSE缺失的數據,這是一個限製。在2010年,超過85%的成年人提供有效的身高和體重的錄音采訪。29日失蹤BMI是最常見的一種原因拒絕(高達8%的失蹤是由於拒絕),19如果與BMI狀態偏差的估計可能意味著在HSE BMI。我們對比CPRD-based和HSE-based BMI統計數據集中在均值(在線補充附錄,列為肥胖比例);這些是主要統計數據發表在HSE趨勢表,所以我們不能看的BMI分布更廣泛的措施可能會感興趣的研究人員使用BMI數據上下文中的公共衛生。最後,我們沒有試圖量化或評論的有用性指數作為衡量肥胖,和研究人員使用BMI數據應該考慮是否最好的測量的目的。

結論

BMI CPRD隨時間變化的數據的完整性和以年齡和性別。BMI記錄可能會變得過時的隨著時間的推移和天真的使用可能會導致誤分類的BMI的地位。我們使用3年截止定義一個最近的體重指數;進一步的研究可能包括係統分析的BMI記錄多長時間可以被認為是“最新的”,以及這是否不同的病人的特點。BMI狀態分配給個人的最優策略研究基於CPRD和類似的電子醫療數據庫可能會依賴於具體的研究人群和研究背景。

引用

視圖抽象

補充材料

  • 補充數據

    僅這個web文件已經由英國醫學雜誌出版集團從一個電子文件提供的作者(年代)和沒有對內容進行編輯。

    在這個數據補充文件:

腳注

  • 貢獻者KB發達的分析策略,處理和分析數據,寫論文。高頻參與討論的數據處理和分析數據,以及論文的寫作。LS參與討論的分析方法來研究和評價分析和論文的寫作。ID參與討論的分析方法來研究和評價分析和論文的寫作。DL參與討論的分析方法來研究和評價分析和論文的寫作。

  • 資金這份報告是獨立研究起源於博士後獎學金(KB)支持的國家健康研究所(pdf - 2011 - 04 - 007)。ID是由MRC方法論研究獎學金。LS支持威康信托基金會高級臨床科學研究獎學金。

  • 相互競爭的利益一個也沒有。

  • 倫理批準這項研究是通過倫敦衛生和熱帶醫學學院的倫理委員會。MHRA獨立的科學顧問委員會。

  • 出處和同行評議不是委托;外部同行評議。

  • 數據共享聲明這個分析是基於一個大型的隨機樣本的臨床實踐研究數據鏈接,由英國提供藥物和保健產品監管機構。作者的許可證不允許使用這些數據與第三方共享原始數據。