Tối ưu hóa kết quả của bạn và thúc đẩy nhiều tác động hơn với AI có thể hành động

Khám phá hàng chục video, ví dụ và bài viết để giúp bạn tìm hiểu AI có thể hành động, Khoa học dữ liệu, AI và hơn thế nữa.
Các hạn chế có giúp giảm tỷ lệ tử vong do covid không?

Vào tháng 7 năm 2021, The Economist đã nhấn mạnh một phát hiện của nhà khoa học dữ liệu Youyang Gu rằng bất bình đẳng là yếu tố tương quan nhất với số ca tử vong do covid. Thật thú vị, ông cũng thấy rằng sự nghiêm ngặt hạn chế không tương quan đơn lẻ với tỷ lệ tử vong do covid. Trong ví dụ này, sử dụng phân tích Suy luận nhân quả của chúng tôi, chúng tôi chỉ ra rằng chỉ số nghiêm ngặt cao hơn có liên quan đến số ca tử vong do covid thấp hơn sau khi được kiểm soát bởi các yếu tố khác nhau như mật độ dân số, tỷ lệ cư dân tại viện dưỡng lão, tuổi trung bình, nhiệt độ trung bình, v.v.

Bộ dữ liệu ban đầu do Gu chuẩn bị bao gồm các biện pháp khác nhau như bất bình đẳng, mật độ dân số, hạn chế nghiêm ngặt và tỷ lệ béo phì cho mỗi tiểu bang. Cụ thể đối với bất bình đẳng, Gu sử dụng chỉ số bất bình đẳng Gini, trong đó 0 có nghĩa là bình đẳng hoàn hảo và một có nghĩa là bất bình đẳng hoàn hảo. Đối với các hạn chế, Gu sử dụng chỉ số nghiêm ngặt được theo dõi bởi một nhóm từ Trường Chính phủ Blavatnik tại Đại học Oxford. Danh sách đầy đủ các chỉ số được bao gồm được liệt kê bên dưới.

Sau khi chọn Phân tích tương quan và tập dữ liệu được tải lên, chúng tôi chọn deaths_per_100k làm mục tiêu tương quan và tất cả các cột khác làm yếu tố so sánh. Sau khi nhấp vào Chạy, Phân tích Tương quan trả về hầu hết các yếu tố tương quan và giá trị Spearman-r của chúng. Chỉ có mối tương quan với ý nghĩa thống kê được hiển thị. Như chúng ta có thể thấy trong biểu đồ dưới đây, chỉ số bất bình đẳng Gini thực sự là yếu tố tương quan nhất trong số tất cả các yếu tố được so sánh. Các yếu tố tương quan tiếp theo là số lượng cư dân trong viện dưỡng lão trên 100 nghìn người, mật độ dân số, tỷ lệ thất nghiệp vào tháng 3 năm 2021 và tỷ lệ tử vong do cúm trung bình.

Như đã quan sát trong nghiên cứu của Gu, chỉ số nghiêm ngặt không tương quan chặt chẽ với các trường hợp tử vong do covid (ít nhất là mối tương quan của nó không có ý nghĩa thống kê). Tuy nhiên, chúng ta không nên đưa ra kết luận rằng chắc chắn không có mối liên hệ nào giữa chỉ số nghiêm ngặt và tử vong do covid vì không có mối tương quan không có nghĩa là không có mối liên hệ. Ví dụ, một mối tương quan không thể phát hiện ra một số liên kết phức tạp như được hiển thị ở hàng dưới cùng của ví dụ này trên Wikipedia.

Để kiểm tra tốt hơn mối liên hệ tiềm năng của mục tiêu và các yếu tố được kiểm tra, tốt hơn là xây dựng một mô hình dự đoán để dự đoán mục tiêu bằng cách sử dụng các yếu tố được kiểm tra làm yếu tố dự đoán của nó. Khi một mô hình dự đoán chất lượng được xây dựng, chúng ta có thể xem xét tầm quan trọng của từng yếu tố dự đoán trong các quyết định của mô hình. Trong Actable AI, điều đó có thể dễ dàng được thực hiện bằng cách chọn Phân tích hồi quy để áp dụng cho tập dữ liệu này. Sau khi chọn cột mục tiêu dự đoán và cột dự đoán, chúng tôi cũng chọn Tối ưu hóa cho hiệu suất để cải thiện hơn nữa chất lượng của mô hình và Xác thực chéo (với 10 lần). Vì bộ dữ liệu nhỏ, Xác thực chéo cung cấp cho chúng tôi nhiều dữ liệu đào tạo hơn và sự không chắc chắn về hiệu suất của mô hình được đào tạo.

Trong hình trên, hiệu suất và tầm quan trọng tính năng của mô hình được đào tạo được hiển thị sau khi chạy phân tích. Điểm màu đen là điểm trung bình và điểm màu đỏ là lỗi tiêu chuẩn của chúng trong các lần phân chia Xác thực chéo. Tầm quan trọng của tính năng được định nghĩa là hiệu suất của mô hình bị mất bao nhiêu khi các giá trị của tính năng đó được xáo trộn ngẫu nhiên.

R2 và sai số bình phương trung bình gốc (RMSE) chỉ ra rằng mô hình có khả năng dự đoán cao (R2 = 0 có nghĩa là không có khả năng dự đoán). Điều thú vị là không giống như trong phân tích tương quan, chỉ số nghiêm ngặt là yếu tố quan trọng thứ 5 trong việc dự đoán số ca tử vong do covid. Nó không mạnh như chỉ số Gini hoặc số lượng cư dân trong viện dưỡng lão nhưng có thể so sánh với béo phì và tỷ lệ phần trăm dân số không phải người da trắng.

Tuy nhiên, tương tự như tương quan, liên kết cũng không có nghĩa là quan hệ nhân quả. Cuối cùng, để thực hiện các hành động có ý nghĩa, chúng tôi quan tâm đến tác động nhân quả của các yếu tố này đối với biến mục tiêu. Cụ thể, nếu chúng ta biết tác động nhân quả của chỉ số nghiêm ngặt đối với các trường hợp tử vong do covid thì chúng ta có thể hành động và điều chỉnh các can thiệp phi dược phẩm khác nhau cho phù hợp. Sử dụng Suy luận nhân quả, người dùng của chúng tôi có thể kiểm soát các yếu tố gây nhiễu khác nhau để chỉ phơi bày tác dụng của một phương pháp điều trị và kết quả nhất định.

Kết quả dưới đây cho thấy khi được kiểm soát bởi các biến số khác (mật độ dân số, bất bình đẳng, tỷ lệ béo phì, tuổi trung bình, tỷ lệ cư dân điều dưỡng, nhiệt độ trung bình, tỷ lệ dân số đô thị) là yếu tố gây nhiễu, chỉ số nghiêm ngặt có mối liên hệ tiêu cực với tử vong do covid (-2,4 với khoảng tin cậy 95% [-0,1 / -4,7]). Điều đó có nghĩa là chúng tôi tin tưởng 95% rằng mức tăng 1,0 trong chỉ số nghiêm ngặt giảm từ 0,1 xuống 4,7 ca tử vong trên 100 nghìn người, với ước tính tốt nhất là 2,4 ca tử vong trên 100 nghìn người.

Tuy nhiên, chúng tôi biết rằng hiệu quả có thể không đồng nhất vì trong các điều kiện khác nhau, hiệu quả của các biện pháp cũng khác nhau. Chúng tôi tiếp tục phân tích hiệu ứng theo tỷ lệ cư dân điều dưỡng bằng cách chọn tính năng làm công cụ sửa đổi hiệu ứng và chạy lại phân tích. Những gì chúng tôi tìm thấy có phần thú vị. Ở các tiểu bang có ít cư dân điều dưỡng hơn trên 100 nghìn người, hiệu ứng trung bình nhỏ hơn và không chắc chắn hơn rất nhiều trong khi ở các bang có nhiều cư dân điều dưỡng trên 100 nghìn người, hiệu quả mạnh hơn đáng kể và có ý nghĩa thống kê hơn (khoảng tin cậy nhỏ hơn và dưới 0).

Biểu đồ nhân quả để ước tính tác động nhân quả của chỉ số nghiêm ngặt đối với tỷ lệ tử vong.

Để kiểm soát hiệu ứng nhân quả ngược, chúng tôi đã thực hiện phân tích tương tự chỉ cho các quốc gia có tỷ lệ tử vong ít hơn mức trung bình và quan sát thấy hiệu ứng tương tự. Vì các trạng thái này có nhiều khả năng áp đặt các hạn chế do phòng ngừa hơn là phản ứng, chúng tôi có thể kết luận rằng hiệu ứng nhân quả ngược không thể ảnh hưởng đến phân tích của chúng tôi.

Trong phân tích này, chúng tôi chứng minh rằng trong vòng 10 phút, người ta có thể sử dụng Actable AI để nhanh chóng tìm ra các yếu tố tương quan và dự đoán nhất đối với các trường hợp tử vong do covid ở các tiểu bang khác nhau của Hoa Kỳ. Người dùng cũng tìm thấy mối quan hệ nhân quả (khi các giả định nhân quả được đáp ứng) giữa chỉ số nghiêm ngặt và tử vong do covid khi các yếu tố khác nhau được kiểm soát. Nó xác nhận rằng chỉ số bất bình đẳng Gini và số lượng cư dân trong viện dưỡng lão là những yếu tố liên quan chặt chẽ đến tử vong do COVID-19. Mặc dù chỉ số nghiêm ngặt không cho thấy mối tương quan với các ca tử vong do COVID-19, nhưng nó được chứng minh là có một số mức độ liên quan dự đoán và có tác động đáng kể khi các yếu tố khác được kiểm soát. Hiệu quả đặc biệt mạnh mẽ hơn ở các tiểu bang có tỷ lệ cư trú điều dưỡng cao hơn.

Bảng điều khiển phân tích

Liên kết

Tập dữ liệu mẫu

Bộ dữ liệu là từ bài báo năm 2021 của Economist nêu bật những phát hiện về lý do tại sao một số nơi có nhiều ca tử vong do COVID-19 hơn những nơi khác. Tập dữ liệu bao gồm 16 biến được liệt kê dưới đây:

deaths_per_100k: Số ca tử vong do covid trên 100K người

dem_margin_2020: Xu hướng bỏ phiếu cho Đảng Dân chủ

perc_25plus_with_bachelors: Tỷ lệ người trên 25 tuổi có bằng Cử nhân

income_per_capita: Thu nhập bình quân đầu người

perc_pop_at_least_1_dose_may_2021: Tỷ lệ dân số được tiêm ít nhất một liều vắc xin vào năm 2021

stringency_index: Chỉ số hạn chế nghiêm ngặt của Trường Chính phủ Blavatnik, Oxford

population_per_sq_mi: Dân số trên một dặm vuông

perc_urban: Tỷ lệ phần trăm dân số sống ở khu vực ubran

median_age: Tuổi trung bình

mean_temperature: Nhiệt độ trung bình

perc_blue_collar_jobs: Tỷ lệ phần trăm số người có việc làm cổ cồn xanh

obesity_rate: Tỷ lệ béo phì

perc_pop_nonwhite: Tỷ lệ phần trăm dân số không phải da trắng

flu_death_rate: Tỷ lệ tử vong do cúm trung bình

gini_coefficient: Chỉ số bất bình đẳng Gini

nursing_resid_per_100k: Số lượng điều dưỡng viên trên 100k người

ActableAI
Công ty TNHH Công nghệ Actable AI
Mã số công ty tại Vương quốc Anh: 12669336
Mã số công ty Malta: C99699