Classification of inbound contacts according to “contact purpose”

Abstract

To improve the knowledge of its customers, a Company can use data about contacts.
If operational data on different channels are not suitable for Customer Relationship Management (CRM), it becomes necessary to define new dimension analysis.
In this topic we describe a methodology to classify inbound contacts according to “contact purpose”.
We propose a definition of contact purpose suitable for contacts from all channels, so that analysis can be done through channels.
We then describe a procedure to apply this definition to inbound operational data contacts, to obtain automatically classified contact data using a Keyword-Classification algorithm.
The same procedure can be applied to any other classification criterion, and to more than one criterion at once.
At last we suggest how this methodology can be nested in a process flow.

Introduction

To improve the knowledge of its customers, a Company can focus on relationship with customers.

To be suitable for CRM modelling and decisions, the general concept of “relationship” must be instanced to become concrete (definible), measurable and updatable.

A Company usually has available data that can be used to instance relationship: data about contacts between customer and company (inbound and outbound), over different channels.

In fact contacts are:

  • Concrete (known definitions),
  • Measurable: defined quantities measurable over time,
  • (Automatically) updated.

In this topic we focus on inbound contacts and describe a methodology to classify contacts according to “contact purpose”.

Inbound contacts data can be collected  from different channels (i.e. web and mobile site, call center). If data are collected from operational systems (ex. Web site logs), they are probably not suitable for CRM analysis: they are punctual data, specific for channel, with limited information usable for analysis.

Significant analysis could be done if inbound contacts were classified by significant criteria defining new analysis dimensions, that is new classification criteria should be independent from channel.

To define a significant classification criterion for contacts, we think in term of “contact purpose”.

We propose a definition of “contact purpose” suitable for contacts from all channels, so that analysis can be done on contact purpose through channels.

We then describe a procedure to apply this definition to inbound operational data contacts, to obtain automatically classified contact data using a Keyword-Classification algorithm.

The same procedure can be applied to any other classification criterion, and to more than one criterion at once.

Definition of Contact purpose

Classification is defined “a priori”.

OpenP Open or Activate Product
NewRes Research on new products and services
OwnRes Research on own products and services
CloseP Close product
Tran Place transactions
Claim Make a complaint
Info Quantitative Information Request
Support Support Request
Other Other

Procedure for classification

A. Initial manual classification (for initial “learning” of algorithm)

Above definition is fitted on operational contacts, starting from a chosen channel, for example web pages:

  • Analysis of site map and first manual classification of pages addresses: analysis of pages distribution on purpose and analysis of page accesses (a sample) distribution on purpose
  • Review of manual classification

Then the definition is generalized to fit also other channels, for example mobile pages addresses and call center call reasons, until it can be considered optimal.

Next steps B. and C. are strictly related, and need reiteration.

B. Definition of keyword list

From initial manual classification is then derived a keyword list to be used by classification algorithm.

The keywords must be as few and as shorter as possible, to preserve broadness of algorithm. This is very important.

C. Development of a Keyword-Classification algorithm

An algorithm implemented to automatically classify contacts. The algorithm:

  • Is based on keyword lists
  • Associates to contact purpose value defined by keywords, according to: a Positional criterion (for example in web pages right positions weigh more than left positions), a Priority criterion (to manage nested keywords and other critical cases)

Keyword list has to be periodically revised, to improve learning of algorithm.

After some learning steps, algorithm becomes more robust, and it is proven to be quite general.

Generalization

Inbound contacts can be classified according to more than one criterion. Every classification criterion becomes a dimension for analysis on this data. The described algorithm is able to manage one or more criteria, simply treating them as independent dimensions, with independent keyword lists.

Nesting in process flow

Classification process can be nested in process flow in different ways, for example:

  • completely automated: leave ambiguous contacts in ‘other’ class, and periodically review ‘other’ list
  • partially left to human evaluation: automatically classify known contacts, and use the algorithm  to ‘propose’ classification for new contacts, that will be seen and approved or modified by analysts.

 

Classificazione dei contatti inbound in base allo “scopo del contatto”

Abstract

Per migliorare la conoscenza dei propri clienti, ogni azienda può utilizzare i dati dei contatti.
Se i dati operazionali provenienti dai diversi canali non sono adatti agli scopi del CRM, si rende necessario definire nuove dimensioni di analisi.
Viene qui descritta una metodologia per classificare i contatti ‘inbound’ (in ingresso all’azienda) in base allo “scopo del contatto”.
Si propone una definizione dello scopo del contatto che sia adattabile ai contatti dei diversi canali inbound, in modo da poter fare delle analisi inter-canale.
Si descrive poi una procedura per applicare tale definizione ai dati operazionali dei canali, per ottenere contatti automaticamente classificati tramite un “algoritmo di classificazione per parole chiave”.
La medesima procedura può essere applicata a qualsiasi altro criterio di classificazione, e anche a più criteri contemporaneamente.
Infine sono riportate alcune indicazioni su come la procedura possa essere innestata nel flusso di processo aziendale.

Introduzione

Per migliorare la conoscenza dei propri clienti, un’azienda può studiare le relazioni con i clienti stessi.

Allo scopo di poter condurre analisi quantitative in ambito CRM (modellizzazione e supporto alle decisioni), il concetto generico di ‘relazione’ deve essere istanziato in modo da essere concreto (definibile), misurabile, aggiornabile.

In genere i dati che possono essere utilizzati a questo scopo sono quelli relativi ai contatti (inbound = in ingresso e outbound = in uscita) tra l’azienda ed i clienti, sui diversi canali.

Infatti i contatti sono per definizione:

  • concreti (generati da definizioni note),
  • misurabili (definiti da regole quantitative applicate nel tempo),
  • (automaticamente) aggiornabili.

Focalizzandosi sui contatti inbound, di seguito è descritta una metodologia per classificare i contatti in base allo “scopo del contatto”.

I dati dei contatti inbound riguardano diversi canali (es. sito web, sito mobile, call center). Se i dati provengono da sistemi operazionali (come il log del sito web), essi probabilmente non sono adatti alle analisi di tipo CRM: si tratta infatti di dati puntuali, specifici per canale, dotati di pochi attributi utilizzabili a scopo di analisi.

Per effettuare delle analisi significative occorre classificare i contatti inbound in base a criteri significativi, che definiscano nuove dimensioni di analisi, in altre parole i nuovi criteri di classificazione devono essere indipendenti dal canale.

Come criterio significativo per la classificazione dei contatti a scopo CRM, si può identificare lo “scopo del contatto”.

Viene proposta una definizione dello “scopo del contatto” che sia adattabile ai contatti di tutti i canali, in modo da poter condurre analisi inter-canale.

Viene poi descritta una procedura per applicare questa definizione ai dati operazionali dei contatti inbound, al fine di classificarli automaticamente tramite un “algoritmo di classificazione per parole chiave”.

La procedura può essere applicata a qualsiasi altro criterio di classificazione, e anche a più criteri contemporaneamente.

Definizione dello Scopo del Contatto

La classificazione è definita a priori:

OpenP Open or Activate Product
NewRes Research on new products and services
OwnRes Research on own products and services
CloseP Close product
Tran Place transactions
Claim Make a complaint
Info Quantitative Information Request
Support Support Request
Other Other

Procedura di classificazione

A. Classificazione manuale iniziale (per l’addestramento ‘iniziale’ dell’algoritmo)

La definizione sopra riportata viene adattata ai contatti operazionali, partendo da un canale scelto, ad esempio dal sito web:

  • Analisi della mappa del sito e classificazione manuale iniziale degli indirizzi delle pagine: analisi della distribuzione delle pagine sullo scopo del contatto ed analisi della distribuzione di un campione di accessi alle pagine sullo scopo del contatto
  • Revisione della classificazione iniziale

Poi la definizione viene generalizzata per adattarsi agli altri canali (per esempio agli indirizzi delle pagine del sito mobile e alle chiamate ricevute dal call center), fino a che non è ritenuta soddisfacente.

I prossimi passi B. e C. sono strettamente correlati, e necessitano un riciclo.

B. Definizione della lista delle parole chiave

Dalla classificazione manuale iniziale viene ricavata una lista di parole chiave che sarà usata dall’algoritmo di classificazione. Le parole chiave devono essere più corte possibile e in numero minore possibile, per preservare la robustezza dell’algoritmo.

C. Sviluppo dell’algoritmo di classificazione per parole chiave

Viene implementato un algoritmo per classificare automaticamente i contatti. L’algoritmo:

  • è basato sulla lista di parole chiave
  • associa ai contatti lo scopo definito dalle parole chiave, basandosi su: un criterio di posizione(per esempio nell’indirizzo di una pagina web le posizioni più a destra devono pesare di più di quelle più a sinistra) e un criterio di priorità (per gestire parole chiave innestate e altri casi critici)

La lista delle parole chiave va periodicamente rivista, per migliorare l’adattamento dell’algoritmo ai nuovi casi.

Dopo alcuni passi di ‘addestramento’, l’algoritmo guadagna in robustezza, e diventa abbastanza generale.

Generalizzazione

I contatti inbound possono essere classificati in base a più criteri contemporaneamente. Ogni criterio di classificazione rappresenta una dimensione di analisi.

L’algoritmo presentato è in grado di gestire uno o più criteri, semplicemente trattandoli come dimensioni indipendenti, con liste di parole chiave indipendenti.

Inserimento nel processo aziendale

Il processo di classificazione qui presentato può essere innestato nel processo aziendale in modi diversi, ad esempio:

  • Completamente automatizzato: lasciare i contatti ambigui nella classe ‘other’, da analizzare periodicamente per eventualmente aggiornare le parole chiave
  • Parzialmente soggetto a valutazione manuale: classificare automaticamente i contatti noti in modo deterministico, e usare l’algoritmo per ‘proporre’ la classificazione dei nuovi (non noti) contatti, classificazione che andrà valutata ed approvata o eventualmente modificata dall’analista.