Tối ưu hóa kết quả của bạn và thúc đẩy nhiều tác động hơn với AI có thể hành động

Khám phá hàng chục video, ví dụ và bài viết để giúp bạn tìm hiểu AI có thể hành động, Khoa học dữ liệu, AI và hơn thế nữa.
Phân bổ cảm ứng đa điểm

Phân bổ đa chạm (MTA) là một phương pháp tiếp thị và phân tích được sử dụng để xác định cách các kênh tiếp thị và điểm tiếp xúc khác nhau đóng góp vào chuyển đổi hoặc kết quả mong muốn, chẳng hạn như bán hàng, tạo khách hàng tiềm năng hoặc một chỉ số hiệu suất chính khác (KPI). Nó nhằm mục đích cung cấp sự hiểu biết toàn diện và chính xác hơn về hành trình của khách hàng bằng cách xem xét nhiều tương tác mà khách hàng có với một thương hiệu trước khi thực hiện một hành động cụ thể.

Các mô hình phân bổ một chạm truyền thống, chẳng hạn như phân bổ nhấp chuột cuối cùng, cung cấp tất cả tín dụng cho chuyển đổi thành điểm tiếp xúc hoặc tương tác cuối cùng ngay trước khi chuyển đổi. Cách tiếp cận đơn giản này có thể dẫn đến sự hiểu biết không chính xác về cách các nỗ lực tiếp thị khác nhau tác động đến hành vi của khách hàng vì nó bỏ qua ảnh hưởng của các điểm tiếp xúc trước đó trong hành trình của khách hàng.

Multi-Touch Attribution có cách tiếp cận nhiều sắc thái hơn và xem xét toàn bộ hành trình của khách hàng, có tính đến các điểm tiếp xúc, kênh và tương tác khác nhau trên đường đi. Có một số mô hình và phương pháp khác nhau trong MTA, bao gồm:

  • Phân bổ tuyến tính: Trong mô hình này, mỗi điểm tiếp xúc trong hành trình của khách hàng được chỉ định một trọng số bằng nhau. Nó giả định rằng mọi tương tác đều đóng một vai trò quan trọng như nhau trong việc chuyển đổi.
  • Phân bổ phân rã thời gian: Mô hình này cung cấp nhiều tín dụng hơn cho các điểm tiếp xúc gần hơn với chuyển đổi và dần dần ít tín dụng hơn cho những người quay ngược thời gian. Nó nhận ra rằng các tương tác gần hơn với chuyển đổi thường có ảnh hưởng hơn.
  • Phân bổ hình chữ U (dựa trên vị trí): Còn được gọi là mô hình "bồn tắm", nó gán tín dụng cao hơn cho các điểm tiếp xúc đầu tiên và cuối cùng trong hành trình của khách hàng, với một số tín dụng được trao cho các điểm tiếp xúc trung gian. Mô hình này thừa nhận tầm quan trọng của cả nhận thức ban đầu và bước chuyển đổi cuối cùng.
  • Mô hình phân bổ tùy chỉnh: Một số tổ chức tạo mô hình phân bổ tùy chỉnh phù hợp hơn với mục tiêu kinh doanh cụ thể và hành vi của khách hàng. Các mô hình này có thể phức tạp và liên quan đến các kỹ thuật phân tích và mô hình hóa dữ liệu.
  • Phân bổ thuật toán: Cách tiếp cận này sử dụng các thuật toán học máy để phân tích dữ liệu lịch sử và xác định mô hình phân bổ chính xác nhất dựa trên hành vi và tương tác thực tế của khách hàng. Nó dựa trên dữ liệu và thích ứng nhiều hơn so với các mô hình dựa trên quy tắc truyền thống.

Phân bổ đa chạm đặc biệt có giá trị trong bối cảnh tiếp thị kỹ thuật số ngày nay, nơi khách hàng thường tương tác với nhiều điểm tiếp xúc và kênh trước khi đưa ra quyết định mua hàng. Bằng cách hiểu tác động tương đối của các điểm tiếp xúc khác nhau, các doanh nghiệp có thể phân bổ ngân sách tiếp thị hiệu quả hơn, tối ưu hóa các chiến dịch và cải thiện ROI tổng thể. Tuy nhiên, việc triển khai MTA có thể là một thách thức, vì nó đòi hỏi quyền truy cập vào dữ liệu toàn diện và khả năng phân tích và giải thích dữ liệu đó một cách chính xác.

Trong bài viết sau, chúng ta sẽ khám phá cách các công cụ của Actable AI có thể được tận dụng để thực hiện MTA. Hai bộ dữ liệu khác nhau sẽ được sử dụng, để chứng minh tính linh hoạt của nền tảng trong việc xử lý các cấu trúc và tính năng dữ liệu khác nhau.

Tập dữ liệu 1

Tập dữ liệu đầu tiên chứa một hàng cho mỗi khách hàng, với các tính năng cho biết liệu khách hàng đã được chuyển đổi thành khách hàng trả tiền hay chưa, kênh nào được sử dụng để tiếp thị, kênh nào được sử dụng để đăng ký, nhóm tuổi của khách hàng, ngôn ngữ hiển thị cho người dùng, v.v. 

Điều quan trọng trước tiên là phải hiểu rõ hơn về dữ liệu và cách các tính năng liên quan đến nhau. Điều này có thể được thực hiện dễ dàng trong Actable AI bằng cách sử dụng các công cụ như phân tích tương quan. Các tham số có thể được đặt như sau:

Cài đặt cho phân tích tương quan

Biến lãi suất, cụ thể là liệu khách hàng đã được chuyển đổi thành khách hàng trả tiền hay chưa, được chỉ định trong trường 'mục tiêu tương quan'. Trong khi đó, bất kỳ tính năng nào mà mối tương quan cần được đo lường với mục tiêu đều được chỉ định trong trường 'các yếu tố so sánh'. Các tùy chọn khác cũng có sẵn, chẳng hạn như số lượng các yếu tố để hiển thị và liệu các giá trị có nên được hiển thị trên biểu đồ thanh hay không.

Sau khi nhấp vào nút 'Chạy' và đợi trong giây lát, kết quả sẽ được tạo và hiển thị cho người dùng:

Biểu đồ tích cực và tiêu cực cho thấy mối tương quan với biến mục tiêu (liệu khách hàng đã được chuyển đổi thành khách hàng trả tiền hay chưa)

Tập trung vào các kênh tiếp thị và đăng ký, có vẻ như 'Quảng cáo cho cùng một công ty' là kênh đăng ký có mối tương quan nhất với việc chuyển đổi khách hàng thành khách hàng trả tiền. Tuy nhiên, nó kém hiệu quả hơn khi được sử dụng như một kênh tiếp thị, nơi email tương quan nhiều hơn với mục tiêu chuyển đổi khách hàng thành khách hàng trả tiền của chúng tôi. 

Bây giờ chúng ta đã hiểu rõ hơn về các tính năng của mình, chúng ta có thể tiến hành đào tạo mô hình học máy với nhiệm vụ dự đoán xem khách hàng có được chuyển đổi thành khách hàng trả tiền hay không. Điều này có thể được thực hiện bằng cách chọn phân tích 'phân loại' với các tùy chọn sau:

Tùy chọn phân tích phân loại

Tương tự như phân tích tương quan, kết quả cần được dự đoán nên được chỉ định trong trường 'mục tiêu dự đoán', trong khi bất kỳ tính năng nào khác nên được sử dụng để dự đoán mục tiêu được chỉ định trong trường 'dự đoán'. 

Một số tùy chọn khác cũng có thể được chỉ định, bao gồm:

Tùy chọn phân tích phân loại

Trong trường hợp này, tùy chọn 'giải thích dự đoán' đã được chọn. Điều này sẽ cho phép tạo ra những gì được gọi là giá trị Shapley có thể giúp chúng ta hiểu mức độ mỗi biến đã tăng hoặc giảm dự đoán. 

Các tùy chọn nâng cao hơn cũng có thể được chỉ định, chẳng hạn như các mô hình được đào tạo và các siêu tham số của chúng. Mặc dù cài đặt mặc định thường hoạt động tốt, bạn có thể muốn chỉ định một số giá trị nhất định theo ý thích của mình hoặc cố gắng điều chỉnh chúng để cải thiện hiệu suất. AI có thể hành động sau đó sẽ tận dụng các kỹ thuật AutoML hiện đại để tự động đào tạo một số mô hình với các siêu tham số khác nhau và chọn mô hình đạt được hiệu suất tốt nhất. 

Tùy chọn mô hình và siêu tham số

Số liệu được sử dụng để tối ưu hóa cũng có thể được chỉ định:

Tùy chọn nâng cao

Một quan sát quan trọng là việc sử dụng ROC AUC làm số liệu tối ưu hóa, phù hợp hơn với các bộ dữ liệu mất cân bằng như trường hợp ở đây. Thông tin chi tiết về tất cả các tùy chọn có sẵn trong phân tích phân loại cũng có thể được tìm thấy trong tài liệu người dùng.

Khi chúng tôi hài lòng với các cài đặt, có thể nhấp vào nút 'Chạy' để bắt đầu quá trình đào tạo mô hình. Khi nó được hoàn thành, một số kết quả được hiển thị:

Chỉ số hiệu suất của mô hình tốt nhất

Trước hết, chúng ta có thể kiểm tra hiệu suất của mô hình bằng cách sử dụng một số số liệu. Mỗi trong số này so sánh các giá trị cơ bản của chuyển đổi khách hàng với những giá trị được dự đoán bởi mô hình tốt nhất. Như có thể quan sát, kết quả trong trường hợp này khá tốt, với ROC AUC (số liệu tối ưu hóa đã chọn của chúng tôi) có giá trị là 85,9%.

Các số liệu này chỉ ra rằng mô hình sẽ hoạt động tốt khi được sử dụng trên dữ liệu vô hình trong thế giới thực (dữ liệu không được mô hình sử dụng khi đào tạo nó). ROC và đồ thị nhớ lại chính xác cũng có thể được xem:

ROC

Đường cong thu hồi chính xác

Ngưỡng xác suất trên đó các dự đoán được gán cho lớp dương (tức là khách hàng đã được chuyển đổi) cũng có thể được điều chỉnh. Theo mặc định, nó tương ứng với 0,5, nhưng nhấp vào đường cong thu hồi chính xác sẽ điều chỉnh giá trị của nó. Kết quả cũng được cập nhật để phù hợp với ngưỡng mới này. Ngưỡng này cũng ảnh hưởng đến ma trận nhầm lẫn, nơi bạn có thể nhanh chóng kiểm tra lớp nào có thể gây nhầm lẫn cho mô hình được đào tạo:

Ma trận nhầm lẫn

Trong trường hợp này, mô hình đáng tin cậy hơn trong việc dự đoán liệu khách hàng có chuyển đổi hay không so với khi khách hàng đã được chuyển đổi (87,84% so với 69,23%). Tuy nhiên, như đã đề cập, việc điều chỉnh ngưỡng xác suất có thể cải thiện độ chính xác của việc dự đoán lớp dương (với chi phí chính xác thấp hơn cho lớp âm).

Sau đó, chúng ta có thể quan sát những tính năng nào được mô hình coi là quan trọng:

Tính năng quan trọng của mô hình tốt nhất

Rõ ràng là kênh đăng ký là tính năng quan trọng nhất, tiếp theo là kênh tiếp thị. Các tính năng khác dường như không hữu ích và một số thậm chí có thể ảnh hưởng đến hiệu suất (ví dụ: nhóm tuổi). 

Tiếp theo, chúng ta có thể kiểm tra các giá trị thô của các dự đoán và các giá trị Shapley được đề cập trước đó:

Giá trị dự đoán, giá trị chân lý cơ bản và giá trị Shapley

Như có thể quan sát, mỗi hàng chứa ba cột mới: một cho lớp âm (khách hàng không được chuyển đổi), một cho lớp dương (khách hàng được chuyển đổi) và một cho lớp dự đoán (dựa trên giá trị ngưỡng đã thảo luận trước đó). 

Hơn nữa, mức độ mà mỗi biến ảnh hưởng đến kết quả cũng được đưa ra bằng màu đỏ hoặc xanh lá cây; Giá trị màu đỏ chỉ ra rằng giá trị đã làm giảm giá trị của kết quả (tức là xác suất của lớp dương), trong khi các giá trị màu xanh lá cây chỉ ra rằng giá trị đã làm tăng giá trị của dự đoán. Các giá trị này được tạo ra cho từng mẫu cụ thể, cho phép phân tích chi tiết cao về mô hình và cách mỗi biến ảnh hưởng đến kết quả. Ví dụ: xem qua cột kênh đăng ký cho biết rằng "Quảng cáo cho cùng một công ty" có xu hướng tăng xác suất dự đoán nhiều nhất. Điều này cũng phù hợp với những gì đã được quan sát để phân tích tương quan. 

Phân tích sâu hơn về cách các dự đoán mô hình khác nhau giữa các giá trị khác nhau của các biến cũng có thể được kiểm tra trong các biểu đồ PDPICE được giới thiệu gần đây:

PDP / ICE cho kênh đăng ký

Biểu đồ ICE cho thấy ảnh hưởng của một tính năng đối với kết quả, bằng cách đóng băng tất cả các giá trị của mẫu ngoại trừ tính năng đang được điều tra. Trung bình trên tất cả các mẫu mang lại biểu đồ PD (PDP). Trong những hình ảnh trên, một lần nữa rõ ràng là quảng cáo cho cùng một công ty cho đến nay là hiệu quả nhất trong việc chuyển đổi khách hàng, mặc dù các kênh khác cũng có một số mức độ hiệu quả.

Thông tin thêm về mô hình tốt nhất và các mô hình khác đã được đào tạo cũng có thể được xem trong tab 'bảng xếp hạng':

Số liệu của tất cả các mô hình được đào tạo

Ngoài số liệu đánh giá đã chọn, lượng thời gian cần thiết để đào tạo mô hình và thực hiện các dự đoán được đưa ra. Điều này giúp chúng tôi xác định xem lượng thời gian cần thiết để mô hình hoạt động có đủ cho ứng dụng nhất định hay không. Lưu ý rằng thời gian suy luận mong muốn cũng có thể được chỉ định trong tab 'Nâng cao'. Các siêu tham số và biến đã được mô hình sử dụng cũng được hiển thị, cho phép chúng ta hiểu rõ hơn về thành phần mô hình. 

Khi chúng tôi hài lòng với mô hình được đào tạo, nó có thể được sử dụng với dữ liệu mới bằng cách chọn tab 'Mô hình trực tiếp' nơi các dự đoán có thể được tạo bằng tập dữ liệu mới. Giá trị dự đoán cũng có thể được nhập tương tác dưới dạng và dự đoán được tạo nhanh chóng:

Tab 'Mô hình trực tiếp'

Nếu các tùy chọn trong tab 'Can thiệp' được đặt, thì cũng có thể sử dụng phân tích phản thực tế để xác định ảnh hưởng của biến điều trị (ví dụ: đăng ký kênh) đối với kết quả dự đoán và có được dự đoán mới. Nói cách khác, điều gì xảy ra với xác suất dự đoán nếu các kênh bị thay đổi? Nguyên nhân phổ biến, còn được gọi là yếu tố gây nhiễu, là các biến có thể ảnh hưởng đến cả kết quả và biến được can thiệp. Những điều này cũng có thể được chỉ định trong trường 'nguyên nhân phổ biến', cho phép các kỹ thuật suy luận nhân quả mang lại ước tính mới về việc liệu khách hàng có được chuyển đổi dựa trên mối quan hệ nhân quả hay không:

API cũng có thể được sử dụng để tích hợp mô hình vào ứng dụng hiện có của bạn (ứng dụng web, ứng dụng dành cho thiết bị di động, v.v.) . Nhấp vào 'Tab API trực tiếp' và tất cả các chi tiết của API được hiển thị:

Tab 'API trực tiếp'

Cuối cùng, mô hình đã đào tạo cũng có thể được xuất và sử dụng trực tiếp trong Python bằng cách làm theo hướng dẫn trong tab 'Mô hình xuất':

Tab "Xuất mô hình"

Tập dữ liệu 2

Tập dữ liệu thứ hai sẽ được khám phá tương tự như tập dữ liệu đầu tiên, nhưng các kênh được biểu diễn dưới dạng các cột riêng lẻ. Hơn nữa, giá trị thể hiện số lần người dùng đã tương tác với kênh trong quá khứ. Do đó, một bối cảnh lịch sử được cung cấp, tóm tắt tất cả các hồ sơ trước đó của người dùng. 

Chúng ta có thể một lần nữa đào tạo một mô hình phân loại bằng cách sử dụng các tùy chọn bên dưới:

Tùy chọn phân tích phân loại

Các kết quả sau đây thu được:

Chỉ số hiệu suất của mô hình tốt nhất

Ma trận nhầm lẫn

Như có thể quan sát, mô hình dường như ủng hộ dự đoán lớp âm, có thể là do tập dữ liệu bị mất cân bằng (chứa nhiều ví dụ tiêu cực hơn các ví dụ tích cực). Tuy nhiên, như đã thảo luận trước đó, ngưỡng xác suất có thể được điều chỉnh để cải thiện hiệu suất cho dự đoán lớp tích cực:

Chỉ số hiệu suất của mô hình tốt nhất

Ma trận nhầm lẫn

Như có thể quan sát, mô hình hiện nay tốt hơn nhiều trong việc dự đoán lớp tích cực, với chi phí giảm hiệu suất khi dự đoán lớp tiêu cực. Tuy nhiên, mức tăng hiệu suất cho dự đoán lớp tích cực cao hơn sự mất hiệu suất khi dự đoán lớp tiêu cực, vì vậy có thể lập luận rằng đây là ngưỡng tổng thể tốt hơn mang lại hiệu suất cân bằng hơn giữa hai lớp. Ngưỡng có thể được điều chỉnh thêm cho phù hợp với ứng dụng và nhu cầu cụ thể, ví dụ để dự đoán chính xác lớp dương ngay cả khi dự đoán cho lớp âm được giảm hơn nữa.

Tất nhiên, chúng tôi không thực hiện bất kỳ tối ưu hóa thông số hoặc cài đặt nào ngoài việc thay đổi chỉ số tối ưu hóa. Ví dụ: tùy chọn 'Tối ưu hóa chất lượng' có thể được bật để cải thiện hiệu suất (với chi phí thời gian đào tạo lâu hơn), siêu tham số mô hình có thể được điều chỉnh và có thể bật số lượng thử nghiệm lớn hơn sao cho nhiều mô hình có phạm vi tham số lớn hơn được đào tạo. Điều này làm tăng khả năng các mô hình tốt hơn có thể được đào tạo.

Vì mỗi kênh được thể hiện trong cột riêng của nó, tầm quan trọng của tính năng có thể được sử dụng để xác định sự khác biệt về tầm quan trọng giữa các kênh:

Tính năng quan trọng của mô hình tốt nhất

Trong trường hợp này, có vẻ như tất cả các kênh đều quan trọng như nhau, mặc dù video trực tuyến dường như hữu ích hơn một chút trong việc chuyển đổi khách hàng. Tương tự như tập dữ liệu đầu tiên, chúng ta cũng có thể kiểm tra các giá trị Shapley và xác suất dự đoán cho mỗi mẫu:

Giá trị dự đoán, giá trị chân lý cơ bản và giá trị Shapley

Các giá trị Shapley một lần nữa giúp hiểu rõ hơn về cách mỗi tính năng đóng góp vào xác suất chuyển đổi cho từng khách hàng riêng lẻ. Điều này cho phép chúng tôi điều chỉnh chiến lược tiếp thị của mình để tối ưu hóa cơ hội chuyển đổi khách hàng.

Thông tin thêm về các chức năng khác của nền tảng cũng có thể được tìm thấy trong tài liệu hướng dẫn người dùng.

ActableAI
Công ty TNHH Công nghệ Actable AI
Mã số công ty tại Vương quốc Anh: 12669336
Mã số công ty Malta: C99699