이상값 평가자를 탐지하는 분석 방법
홈페이지홈페이지 > 소식 > 이상값 평가자를 탐지하는 분석 방법

이상값 평가자를 탐지하는 분석 방법

Aug 22, 2023

BMC 의학 연구 방법론 23권, 기사 번호: 177(2023) 이 기사 인용

112 액세스

측정항목 세부정보

역학 및 의학 연구는 연구 참가자의 노출 또는 결과를 측정하기 위해 평가자에게 의존하는 경우가 많으며, 연관성에 대한 유효한 추정치는 데이터의 품질에 따라 달라집니다. 측정 오류를 조정하기 위해 통계적 방법이 제안되었음에도 불구하고 종종 검증할 수 없는 가정에 의존하고 이러한 가정이 위반될 경우 편향된 추정으로 이어질 수 있습니다. 따라서 데이터 수집 단계에서 데이터 품질을 향상시키기 위해서는 잠재적인 '이상치' 평가자를 탐지하는 방법이 필요합니다.

본 논문에서는 평가 결과가 상대 평가자보다 높거나 낮은 경향이 있는 '아웃라이어' 평가자를 탐지하기 위한 2단계 알고리즘을 제안합니다. 첫 번째 단계에서는 회귀 모델을 적합시켜 평가자의 효과를 얻습니다. 두 번째 단계에서는 '이상치' 평가자를 탐지하기 위해 가설 검정을 수행합니다. 여기서 각 가설 검정의 검정력과 모든 검정 간의 거짓 발견률(FDR)을 모두 고려합니다. 우리는 제안된 방법을 평가하기 위해 광범위한 시뮬레이션 연구를 수행하고, 청력 손실의 위험 요소를 조사하기 위한 역학 연구인 청력 보존 연구의 청력학 평가 부문의 데이터 수집 단계에서 잠재적인 '이상' 청력학자를 탐지하여 방법을 설명합니다. 간호사 건강 연구 II에서.

우리의 시뮬레이션 연구는 우리의 방법이 진정한 '이상치' 평가자를 탐지할 수 있을 뿐만 아니라 진정한 '정상' 평가자를 잘못 거부할 가능성이 적다는 것을 보여줍니다.

우리의 2단계 '이상치' 탐지 알고리즘은 '이상치' 평가자를 효과적으로 탐지할 수 있는 유연한 접근 방식이므로 데이터 수집 단계에서 데이터 품질을 향상시킬 수 있습니다.

동료 검토 보고서

위험 요인과 질병 결과 사이의 관계를 조사하는 많은 의학 및 역학 연구는 여러 평가자(예: 임상의, 기술자)에 의존하여 연구 참가자의 관심 노출이나 결과를 측정합니다. 예를 들어, 청력 손실에 대한 대규모 역학 연구에서 순음 청력 측정은 일반적으로 음향 처리 부스에서 여러 청력학자 또는 훈련된 기술자에 의해 획득됩니다[1,2,3]. 마찬가지로, 시력에 대한 대규모 연구에서 시력 테스트는 진료소 환경에서 여러 평가자가 수행하는 경우가 많습니다[4, 5]. 또한, 여러 평가자가 데이터를 수집하는 것과 관련된 잠재적인 문제는 테스트 측정값을 얻기 위해 자동화된 청력계[6]와 같은 비인간 테스트 방법으로 수집된 데이터에 의존하는 연구로 확장될 수도 있습니다. 위험 요인과 질병 결과 사이의 연관성에 대한 정확한 추정치를 얻는 것은 사용된 통계적 방법뿐만 아니라 데이터 자체의 품질에도 달려 있습니다. 품질이 좋지 않은 데이터에서 발생하는 측정 오류를 조정하기 위해 많은 분석 방법이 제안되었지만 이러한 방법은 일반적으로 검증할 수 없는 가정에 의존하고[7] 추정의 정확성에 대한 비용을 지불합니다. 따라서 통계 분석 단계에서 품질이 낮은 데이터로 인한 편향을 조정하기 위해 통계적 방법을 사용하는 것보다 더 나은 품질의 데이터를 수집하는 것이 더 좋습니다. 본 논문에서는 노출이나 결과 측정에 따른 문제를 신속하게 발견하고 해결할 수 있도록 데이터 수집 단계에서 품질 관리 방법을 제안합니다.

우리 작업은 미국에 등록된 116,430명의 여성 간호사로 구성된 진행 중인 코호트 연구인 NHS II(Nurse's Health Studies II) 참가자의 청력 상실 위험 요인을 조사하는 청력 보존 연구(CHEARS)에 의해 동기가 부여되었습니다. 1989년 등록 당시 나이는 25~42세였습니다[8]. CHEARS 청각 평가 암(AAA)은 청력 수준의 데시벨 또는 dB HL로 측정된 순음 공기 및 골전도 청력 측정 청력 역치(처음 감지되는 순음의 소리 강도)의 종방향 변화를 평가했습니다. 기존 주파수(0.5-8kHz)의 전체 범위에 걸쳐 [9]. 기본 테스트는 자체 보고된 청력 상태가 '훌륭함', '매우 좋음' 또는 '약간의 청력 문제'가 있고 미국 전역의 19개 CHEARS 테스트 장소 중 한 곳 근처에 거주하는 3,749명의 여성을 대상으로 수행되었습니다[9]. 3년 추적 테스트는 3,136명의 참가자(84%)를 대상으로 완료되었습니다. 신뢰할 수 있는 청력 측정값을 얻기 위해서는 다른 청력학자보다 더 높거나 낮은 청력 테스트 측정값을 갖는 경향이 있는 잠재적인 '이상한' 청각학자를 탐지하는 것이 중요합니다. '이상한' 청력학자가 식별되면 이 청력학자가 사용하는 장치를 검사할 수 있으며 필요한 경우 데이터 수집 단계에서 조기 개입이 수행될 수 있습니다. 더욱이, 이러한 이상치 정보는 데이터 분석 접근 방식에 중요한 영향을 미칠 수 있습니다.

10 \text { dB}\)) coefficient estimate than their counterparts, and Audiologist 4 has a much smaller (\(<10 \text { dB}\)) coefficient estimate than the rest of the audiologists. Moreover, Audiologists 14, 15, 22, 47, 48, 54, 55 and 59 have a mildly different (5-10\(\text { dB}\)) coefficient estimates from the average effect./p>0\). A challenge of this method might be how to select a. We will consider this method in our future research and compare it with the current method. Moreover, when calculating the evaluator-specific significance level, the knowledge of the alternative hypothesis is needed. However, if the prior knowledge is not available, we recommend performing sensitivity analysis for a series of reasonable values of the alternative hypothesis. In addition, the FDR approximation in Eq. (2) holds when the number of hypotheses (M) being conducted is large. However, when M is small, alternatively, we can use the Benjamini-Hochberg (BH) procedure to control the FDR [15]. The BH procedure proceeds by first specifying an FDR level \(\alpha\), and sort the null hypothesis based on p-values in ascending order (\(P_{(1)}, P_{(2)},\ldots , P_{(M)}\)). Then the largest k such that \(P_{(k)}\le \frac{k}{M}\alpha\) is obtained, and the first k null hypotheses will be rejected. The BH procedure can ensure that the FDR is controlled at level \(\alpha\). However, different from our approach, the BH procedure does not consider the power of tests and to be conservative, we might use a relatively larger \(\alpha\) level such as 0.1 when conducting the BH procedure./p>