3 fattori che rendono la business intelligence davvero efficace

Durante l’esperienza maturata da Nextbit in importanti progetti di business intelligence, abbiamo rilevato 3 aspetti di vitale importanza per il successo del progetto e per la qualità dell’informazione fornita:

Significatività

L’ acquisizione di dati significativi è un processo che parte dal porre le domande giuste alle persone giuste. A questo scopo non sono necessarie capacità tecniche, bensì doti relazionali per ottenere le informazioni essenziali.

Una volta terminata questa attività è necessario eseguire una valutazione allo scopo di stabilire quali dati siano effettivamente disponibili per rispondere alle domande e raggiungere gli obiettivi.

Questo approccio graduale integrato in una Road-map è molto utile per identificare gli obiettivi intermedi, individuare le priorità, stabilire delle aspettative realistiche e fornire una previsione di quando il progetto sarà concluso.

Affidabilità

I dati e le informazioni fornite devono essere corrette ed accurate. Dal momento che le informazioni provenienti dalla business intelligence vengono utilizzate allo scopo di prendere decisioni strategiche, informazioni inesatte possono creare molti danni. Se non si è convinti da subito che il progetto possa fornire informazioni accurate, è meglio abbandonare il progetto.

In fase di analisi, l’analista deve assicurarsi di avere sufficienti risorse, sia economiche che tecniche, per garantire al progetto risultati di qualità.

Al fine di garantire un’elevata qualità dei dati, è necessario implementare strumenti di diagnostica come parte integrante del flusso quotidiano di aggiornamento dei dati. Infatti, nel processo di trasformazione dei dati è opportuno garantire più livelli di diagnostica. Noi usiamo tipicamente tre livelli di diagnostica:

Livello 0 – struttura delle tabelle, nomi e formati delle variabili (colonne)

Level 1 – valori contenuti in ciascuna variabile

Level 2 – controlli logici incrociati su diverse variabili (e.g. se il cliente ha flag attivo, la data di fine attività deve essere nulla)

La creazione di reportistica automatizzata è un passo importante verso il raggiungimento di informazioni affidabili e permette di fornire agli analisti e agli utenti una chiara visione dei dati disponibili per l’analisi e la modellazione.

Di seguito viene proposto un esempio di reportistica che può essere impostata per aumentare l’affidabilità dei dati e la comunicazione:

  • Statistiche relative alle variabili (interessanti allo scopo di costruire modelli)
    • Percentuale di dati mancanti
    • Statistiche sulle varibiabili continue
    • Statistics sulle variabili discrete
    • Indicatori relativi agli outlier
  • Dizionario Dati ad aggiornamento automatizzato (necessario per avere analisi dati e modelli aggiornati)
    • Un dizionario dati ad aggiornamento automatizzato corredato da nome, descrizione e dominio delle variabili.
  • Report relativi a parametri e regole (interessanti per la costruzione e la manutenzione di modelli)
    • Selezione delle variabili per l’inclusione / esclusione dai modelli
    • Regole di esclusione (basate sui valori delle variabili)
    • Controlli sui valori storici dei dati
  • Reportistica di sistema (necessario per avere analisi dati aggiornate)
    • Data e ora di ultimo aggiornamento delle variabili
    • Regole di diagnostica sui valori dei singoli indicatori

Disponibilità del dato

Un progetto di “Data Intelligence” di successo deve essere in grado di fornire le informazioni necessarie nel momento in cui sono richieste. Ci sono due aspetti importanti al fine di ottenere una pronta disponibilità dei dati: il primo è la condivisione dei risultati e delle analisi prodotte, il secondo è il costante aggiornamento delle informazioni.

Entrambi sono aspetti vitali per un progetto di “Data Intelligence” di successo. Per la condivisione dei risultati ci sono una serie di strumenti di web reporting che sono efficaci. Nextbit a questo scopo utilizza spesso e con profitto QlikView. Per il costante aggiornamento delle informazioni utilizziamo programmi di aggiornamento schedulati in modo dinamico, sfruttando elaborazioni parallele e / o un sistema di schedulazione dei processi basato su semafori.

Conclusione

Gli aspetti sopra descritti sono definiti come R Cube Methodology (Relevant, Reliable, Readily Available).

 

3 things that make business intelligence really effective

In Nextbit’s experience with major business intelligence projects, we find the following three aspects to be of vital importance in the success of the project and the quality of information provided:

Relevance

Capturing Relevant data is a process that starts from asking the right questions from the outset to the right person, this is not a technical skill, it focuses on relationship skills and the ability to ask questions and obtain information. It is essential in every project.

When this task is complete an assessment should follow on what data is available to answer questions and objectives. In difficult projects, it is advisable to build a Road-map, so as to plan for the collection of outstanding data necessary that may not be readily available.

This step-wise approach embedded in a Road-map is very helpful in breaking-up ongoing objectives, identifying priorities, setting expectations and providing a time frame for deliverables.

Reliability

Data and information provided needs to be correct and accurate. Since business intelligence information is used for decision making purposes, inaccurate information creates more damage than no information at all. If you are not convinced that the outcome of the project will be accurate information it is best to avoid starting the project.  

As part of the assessment analysis, the analyst should make sure that enough resources, budget and skills are available to ensure the quality of the project outcome.

For ensuring initial and ongoing data quality, diagnostic tools can be implemented as part of the daily data refresh process. Infact multiple Diagnostic levels should be implemented in data transformation process. We typically use three levels of diagnostics:

Level 0 – table structure, variable (column) name and formats applied

Level 1 – values contained in each variable (dataset column)

Level 2 – logical checks among different variables (e.g. if client is flagged as active, termination date should be null)

 

Setting up automated reporting is an important step on achieving Reliable data intelligence and proactive communication to analysts and user on the data available for analysis and modeling.

Below is an example of the reporting that can be set up to increase reliability and communication:

  • Automated Variable Statistics Report (Insightful for modeling purposes)
    • Percentage of missing
    • Statistics on continuous numeric variables
    • Statistics on discrete (classification / ordinal) variables
    • Outliers indicator
  • Auto-Updated Data Dictionary (Necessary for up-to-date data analysis and modeling)
    • An automatically updated data dictionary with variable and transformation names, descriptions and valid domains.
  • Parameters and criteria Reporting (Insightful for modeling purposes and model maintenance)
    • Variable selection for inclusion/exclusion in models
    • Rules/Criteria for exclusion (based on variable values)
    • Limit controls and tolerance levels on historical data values
  • System Reporting(Necessary for up-to-date data analysis)
    • Date and time of most recent update of indicator/variable
    • Diagnostic rules results on single variable/KPI

Readily Available

A successful Data Intelligence project provides the necessary information when required. There are two important aspects to Readily Accessible Data: the first is on propagation of the results/analysis produced, the second is on freshness of the information.

Both aspect are vital to a successful data intelligence project; while on propagation there are a number of web reporting tools that are effective. At Nextbit we like Qlikview in particular and often use it for information propagation. For freshness of information we deploy dynamically scheduled updates, this can be achieved using parallel processing and/or a light-traffic system in process scheduling.

Conclusion

The aspects above are what we refer to as the R Cube Methodology (Relevant, Reliable, Readily Available).

Presentazione del blog di Nextbit

Ciao a tutti e benvenuti nel blog di nextbit! Abbiamo deciso di pubblicare il nostro blog con l’obiettivo di creare e condividere contenuti sulla “Data Intelligence”; abbiamo infatti intenzione di condividere informazioni, le nostre attività attuali e cosa stiamo pensando di fare nel prossimo futuro in questo ampio ambito.

Il nostro gruppo di lavoro punta sempre all’innovazione, pertanto pubblicheremo contenuti relativi alle attività che abbiamo in mente di intraprendere e a tutto quanto riteniamo di interesse, sperando di ricevere i vostri commenti e le vostre considerazioni.

Incoraggiamo quindi i lettori a contribuire direttamente con i propri articoli, è possibile farlo scrivendoci alla pagina web http://www.nextbit.it/contact_form.php.

Gli argomenti dei nostri articoli riguarderanno: Business Intelligence, Modelli statistici, Modelli in ambito Marketing, Modelli in ambito Rischio, Social CRM, Social Media Metrics, Programmazione SAS e qualsiasi argomento di nostro e vostro interesse professionale.

Seguiteci!

Nextbit blog presentation

Hello and welcome to the Nextbit blog! We have started this blog with the goal of creating a dynamic online place dedicated to “Data Intelligence”; we’ll be sharing information about what we are doing and what we are planning on doing in the near future on this broad topic.

Our focus is always on innovation, so we will be posting our thoughts and anything we consider of interest, your comments and feedback is extremely welcome.

We encourage our reader to contribute with their own articles, you can write your own post and send it to us, using this form http://www.nextbit.it/contact_form.php.

Our post is likely to include information about: Business Intelligence, Data Modeling, Marketing Models, Risk Models, Social CRM, Social Media Metrics, SAS Programming and anything else that will attract our or your professional attention. Stay tuned!