complete guide big data analytics
Αυτός είναι ένας ολοκληρωμένος οδηγός για το Big Data Analytics με τις περιπτώσεις χρήσης, την αρχιτεκτονική, τα παραδείγματα και τη σύγκριση με το Big Data and Data Science:
Τα μεγάλα αναλυτικά δεδομένα έχουν προσελκύσει επειδή εταιρείες όπως το Facebook, το Google και το Amazon έχουν δημιουργήσει τα δικά τους νέα πρότυπα κατανεμημένης επεξεργασίας δεδομένων και αναλυτικών στοιχείων για να κατανοήσουν τις τάσεις των πελατών τους για εξαγωγή αξίας από μεγάλα δεδομένα.
Σε αυτό το σεμινάριο, εξηγούμε τα μεγάλα αναλυτικά δεδομένα και το συγκρίνουμε με το Big Data and Data Science. Θα καλύψουμε τα απαραίτητα χαρακτηριστικά που πρέπει να έχουν οι επιχειρήσεις στη μεγάλη στρατηγική δεδομένων τους και τη μεθοδολογία που λειτουργεί. Θα αναφέρουμε επίσης τις τελευταίες τάσεις και ορισμένες περιπτώσεις χρήσης των αναλυτικών δεδομένων.
Όπως φαίνεται στην παρακάτω εικόνα, το Analytics απαιτεί κάποιον να χρησιμοποιεί δεξιότητες πληροφορικής, επιχειρηματικές δεξιότητες και επιστήμη δεδομένων. Τα μεγάλα αναλυτικά δεδομένα βρίσκονται στο επίκεντρο της χρήσης αξιών από μεγάλα δεδομένα και βοηθούν στη συλλογή αναλώσιμων πληροφοριών για έναν οργανισμό.
(εικόνα πηγή )
Τι θα μάθετε:
- Τι είναι το Big Data Analytics
- συμπέρασμα
Τι είναι το Big Data Analytics
Το Big Data Analytics ασχολείται με τη χρήση μιας συλλογής στατιστικών τεχνικών, εργαλείων και διαδικασιών ανάλυσης στο Big Data.
Συνιστάται Διαβάζοντας => Εισαγωγή στα μεγάλα δεδομένα
Είναι τα αναλυτικά στοιχεία που βοηθούν στην εξαγωγή πολύτιμων προτύπων και σημαντικών πληροφοριών από μεγάλα δεδομένα για την υποστήριξη της λήψης αποφάσεων βάσει δεδομένων. Λόγω της εμφάνισης νέων πηγών δεδομένων, όπως τα μέσα κοινωνικής δικτύωσης και τα δεδομένα IoT, τα μεγάλα δεδομένα και τα αναλυτικά στοιχεία έχουν γίνει δημοφιλή.
Αυτή η τάση δημιουργεί έναν τομέα πρακτικής και μελέτης που ονομάζεται «επιστήμη δεδομένων» που περιλαμβάνει τις τεχνικές, τα εργαλεία, τις τεχνολογίες και τις διαδικασίες εξόρυξης δεδομένων, καθαρισμού, μοντελοποίησης και οπτικοποίησης.
Big Data Vs Big Data Analytics Vs Data Science
ΠΡΟΣ ΤΗΝ σύγκριση μεταξύ των μεγάλων δεδομένων, της επιστήμης δεδομένων και των αναλυτικών στοιχείων μεγάλων δεδομένων μπορεί να γίνει κατανοητό από τον παρακάτω πίνακα.
Βάση | Μεγάλα δεδομένα | Επιστημονικά δεδομένα | Big Data Analytics |
---|---|---|---|
Εργαλεία & Τεχνολογίες | Hadoop Ecosystem, CDH, Cassandra, MongoDB, Java, Python, Talend, SQL, Rapid Miner | R, Python, Jupyter, Data Science Workbench, IBM SPSS, Tableau | Spark, Storm, Knime, Data Wrapper, Lumify, HPCC, Qubole, Microsoft HD |
Εργατικοί ρόλοι και δεξιότητες | Συντήρηση υποδομής αποθήκευσης, επεξεργασία δεδομένων και γνώσεις για το Hadoop και ενσωμάτωσή της με άλλα εργαλεία. | Μετασχηματισμός δεδομένων, Μηχανική Δεδομένων, Διαμάχη Δεδομένων, Μοντελοποίηση Δεδομένων και Οπτικοποίηση | BI και Advanced Analytics, Στατιστική, Μοντελοποίηση δεδομένων και Μηχανική Μάθηση, Μαθηματικές δεξιότητες, Επικοινωνία, Συμβουλευτικές υπηρεσίες. |
Ονομασίες | Αρχιτέκτονας Big Data Μεγάλος προγραμματιστής δεδομένων Μεγάλος Μηχανικός Δεδομένων | Επιστήμονας δεδομένων Μηχανικός μηχανικής μάθησης | Μεγάλος αναλυτής δεδομένων Επιχειρηματικός αναλυτής Μηχανικός επιχειρησιακής νοημοσύνης Ειδικός στο Business Analytics Προγραμματιστής οπτικοποίησης δεδομένων Διαχειριστής του Analytics |
Περίπου Μέσος ετήσιος μισθός σε USD | 100.000 | 90.000 | 70.000 |
Προτεινόμενη ανάγνωση = >> Επιστήμη δεδομένων εναντίον Επιστήμης Υπολογιστών
Τι πρέπει να έχει κάθε στρατηγική για τα μεγάλα δεδομένα
Μια καλά καθορισμένη, ολοκληρωμένη και ολοκληρωμένη στρατηγική συμβάλλει και υποστηρίζει πολύτιμες αποφάσεις που βασίζονται σε δεδομένα σε έναν οργανισμό. Σε αυτήν την ενότητα, έχουμε αναφέρει τα πιο κρίσιμα βήματα που πρέπει να ληφθούν υπόψη κατά τον καθορισμό μιας μεγάλης στρατηγικής ανάλυσης δεδομένων.
Βήμα 1: Αξιολόγηση
Μια αξιολόγηση, ήδη ευθυγραμμισμένη με τους επιχειρηματικούς στόχους, απαιτεί τη συμμετοχή βασικών ενδιαφερόμενων φορέων, τη δημιουργία μιας ομάδας μελών με το σωστό σύνολο δεξιοτήτων, την αξιολόγηση πολιτικών, ατόμων, διαδικασιών και τεχνολογίας και στοιχείων στοιχείων. Εάν απαιτείται, μπορεί κανείς να εμπλέξει πελάτες των αξιολογημένων σε αυτήν τη διαδικασία.
Βήμα 2: Προτεραιότητα
Μετά την αξιολόγηση, κάποιος πρέπει να αντλήσει περιπτώσεις χρήσης, να τις δώσει προτεραιότητα στη χρήση μεγάλων δεδομένων προγνωστικών αναλυτικών στοιχείων, προδιαγραφικών αναλυτικών στοιχείων και γνωστικών αναλυτικών στοιχείων. Μπορείτε επίσης να χρησιμοποιήσετε ένα εργαλείο όπως ο πίνακας προτεραιοτήτων και να φιλτράρετε περαιτέρω τις περιπτώσεις χρήσης με τη βοήθεια των σχολίων και των πληροφοριών από βασικούς ενδιαφερόμενους.
Βήμα 3: Χάρτης πορείας
Σε αυτό το βήμα, απαιτείται να δημιουργήσετε έναν χάρτη πορείας με χρονικό περιορισμό και να τον δημοσιεύσετε για όλους. Ένας χάρτης πορείας πρέπει να περιλαμβάνει όλες τις λεπτομέρειες σχετικά με την πολυπλοκότητα, τα κεφάλαια, τα εγγενή οφέλη των περιπτώσεων χρήσης και τα χαρτογραφημένα έργα.
Βήμα 4: Διαχείριση αλλαγών
Η εφαρμογή της διαχείρισης αλλαγών απαιτεί να διαχειρίζεται τη διαθεσιμότητα, την ακεραιότητα, την ασφάλεια και τη χρηστικότητα των δεδομένων. Ένα αποτελεσματικό πρόγραμμα διαχείρισης αλλαγών, χρησιμοποιώντας οποιαδήποτε υπάρχουσα διακυβέρνηση δεδομένων, ενθαρρύνει δραστηριότητες και μέλη με βάση τη συνεχή παρακολούθηση.
Βήμα 5: Σετ δεξιοτήτων
Ο προσδιορισμός του σωστού σετ δεξιοτήτων είναι ζωτικής σημασίας για την επιτυχία του οργανισμού εν μέσω των τρεχουσών τάσεων στον κλάδο. Επομένως, κάποιος πρέπει να ακολουθήσει τους σωστούς ηγέτες και να φέρει εκπαιδευτικά προγράμματα για να εκπαιδεύσει κρίσιμα ενδιαφερόμενα μέρη.
Βήμα 6: Αξιοπιστία, επεκτασιμότητα & ασφάλεια
Η σωστή προσέγγιση και η αποτελεσματική στρατηγική ανάλυσης μεγάλων δεδομένων καθιστούν τη διαδικασία ανάλυσης αξιόπιστη, με αποτελεσματική χρήση ερμηνεύσιμων μοντέλων που περιλαμβάνουν αρχές επιστήμης δεδομένων. Μια μεγάλη στρατηγική ανάλυσης δεδομένων πρέπει επίσης να περιλαμβάνει πτυχές ασφάλειας από την αρχή για έναν ισχυρό και αυστηρά ολοκληρωμένο αγωγό ανάλυσης.
Αγωγός δεδομένων και διαδικασία για την ανάλυση δεδομένων
Όταν σχεδιάζετε τον αγωγό ανάλυσης δεδομένων, υπάρχουν τρεις θεμελιώδεις πτυχές που πρέπει να λάβετε υπόψη. Αυτά είναι τα εξής:
- Εισαγωγή: Μορφή δεδομένων και επιλογή τεχνολογίας προς επεξεργασία, βασίζεται στην υποκείμενη φύση των δεδομένων. αν τα δεδομένα είναι χρονοσειρές και ποιότητα.
- Παραγωγή: Επιλογή συνδέσμων , οι αναφορές και η οπτικοποίηση εξαρτώνται από την τεχνική εμπειρογνωμοσύνη των τελικών χρηστών και τις απαιτήσεις κατανάλωσης δεδομένων τους.
- Ενταση ΗΧΟΥ: Λύσεις κλιμάκωσης προγραμματίζονται με βάση τον όγκο των δεδομένων για να αποφευχθεί η υπερφόρτωση στο μεγάλο σύστημα επεξεργασίας δεδομένων.
Τώρα ας συζητήσουμε μια τυπική διαδικασία και τα στάδια για έναν μεγάλο αγωγό ανάλυσης δεδομένων.
Στάδιο 1: Κατάποση δεδομένων
Η απορρόφηση δεδομένων είναι το πρώτο και πιο σημαντικό βήμα στον αγωγό δεδομένων. Λαμβάνει υπόψη τρεις πτυχές των δεδομένων.
- Πηγή δεδομένων - Είναι σημαντικό όσον αφορά την επιλογή της αρχιτεκτονικής του αγωγού μεγάλων δεδομένων.
- Δομή δεδομένων - Η σειριοποίηση είναι το κλειδί για τη διατήρηση ομοιογενούς δομής κατά μήκος του αγωγού.
- Καθαριότητα δεδομένων - Το Analytics είναι τόσο καλό όσο τα δεδομένα χωρίς ζητήματα όπως λείπουν τιμές και ακραίες τιμές κ.λπ.
Στάδιο 2: ETL / Αποθήκευση
Η επόμενη σημαντική ενότητα είναι τα εργαλεία αποθήκευσης δεδομένων για την εκτέλεση ETL (Extract Transform Load). Η αποθήκευση δεδομένων σε ένα κατάλληλο κέντρο δεδομένων εξαρτάται από,
- Σκεύη, εξαρτήματα
- Εμπειρία διαχείρισης
- Προϋπολογισμός
(εικόνα πηγή )
Μερικά δοκιμασμένα εργαλεία για ETL / Αποθήκευση σε κέντρα δεδομένων είναι:
- Apache Hadoop
- Κυψέλη Apache
- Παρκέ Apache
- Κινητήρας Presto Query
Οι εταιρείες cloud όπως η Google, η AWS, η Microsoft Azure παρέχουν αυτά τα εργαλεία σε αμοιβή ανά βάση και εξοικονομούν αρχικές κεφαλαιουχικές δαπάνες.
Στάδιο 3: Analytics και οπτικοποίηση
Λαμβάνοντας υπόψη τον περιορισμό του Hadoop στο γρήγορο ερώτημα, πρέπει να χρησιμοποιήσετε πλατφόρμες και εργαλεία ανάλυσης που επιτρέπουν γρήγορη και ad-hoc ερώτηση με την απαιτούμενη οπτικοποίηση των αποτελεσμάτων.
>> Συνιστώμενη ανάγνωση: Μεγάλα εργαλεία δεδομένων
Στάδιο 4: Παρακολούθηση
Μετά τη δημιουργία μιας υποδομής για κατάποση, αποθήκευση και αναλυτικά στοιχεία με εργαλεία οπτικοποίησης, το επόμενο βήμα είναι να παρακολουθείτε τα εργαλεία πληροφορικής και παρακολούθησης δεδομένων. Αυτά περιλαμβάνουν:
- Χρήση CPU ή GPU
- Μνήμη και κατανάλωση πόρων
- Δίκτυα
Ορισμένα εργαλεία που αξίζει να λάβετε υπόψη είναι:
- Datadog
- Γκραφάνα
Τα εργαλεία παρακολούθησης είναι απαραίτητα σε έναν μεγάλο αγωγό ανάλυσης δεδομένων και βοηθούν στην παρακολούθηση της ποιότητας και της ακεραιότητας του αγωγού.
Αρχιτεκτονική Big Data Analytics
Το παρακάτω διάγραμμα αρχιτεκτονικής δείχνει πώς οι σύγχρονες τεχνολογίες χρησιμοποιούν τόσο μη δομημένες όσο και δομημένες πηγές δεδομένων για επεξεργασία Hadoop & Map-μείωση, αναλυτικά συστήματα στη μνήμη και αναλυτικά στοιχεία σε πραγματικό χρόνο για να φέρουν συνδυασμένα αποτελέσματα για λειτουργίες σε πραγματικό χρόνο και λήψη αποφάσεων.
(εικόνα πηγή )
Τρέχουσες τάσεις στο Analytics δεδομένων
Σε αυτήν την ενότητα, έχουμε απαριθμήσει τις βασικές πτυχές που πρέπει να αναζητηθούν κατά την εφαρμογή ή την παρακολούθηση τάσεων των μεγάλων αναλυτικών δεδομένων στον κλάδο.
# 1) Μεγάλες πηγές δεδομένων
Υπάρχουν κυρίως τρεις πηγές Big Data. Παρατίθενται παρακάτω:
- Κοινωνικά δεδομένα: Δημιουργήθηκαν δεδομένα λόγω χρήσης κοινωνικών μέσων. Αυτά τα δεδομένα βοηθούν στην κατανόηση του συναισθήματα και συμπεριφορά των πελατών και μπορεί να είναι χρήσιμο στο μάρκετινγκ αναλυτικών στοιχείων.
- Δεδομένα μηχανήματος: Αυτά τα δεδομένα λαμβάνονται από βιομηχανικό εξοπλισμό και εφαρμογές που χρησιμοποιούν αισθητήρες IoT. Βοηθά στην κατανόηση των ανθρώπων η ΣΥΜΠΕΡΙΦΟΡΑ και παρέχει πληροφορίες σχετικά με διαδικασίες .
- Δεδομένα συναλλαγών: Δημιουργείται ως αποτέλεσμα τόσο εκτός σύνδεσης όσο και διαδικτυακών δραστηριοτήτων χρηστών σχετικά με εντολές πληρωμής, τιμολόγια, αποδείξεις κ.λπ. Οι περισσότερες από αυτές τις ανάγκες δεδομένων προ επεξεργασία και καθάρισμα προτού χρησιμοποιηθεί για αναλυτικά στοιχεία.
# 2) Αποθήκευση δεδομένων SQL / NoSQL
Σε σύγκριση με παραδοσιακές βάσεις δεδομένων ή RDBMS, οι βάσεις δεδομένων NoSQL αποδεικνύονται καλύτερες για εργασίες που απαιτούνται για μεγάλα αναλυτικά δεδομένα.
Οι βάσεις δεδομένων NoSQL μπορούν εγγενώς να χειριστούν τα μη δομημένα δεδομένα αρκετά καλά και δεν περιορίζονται σε ακριβές τροποποιήσεις σχήματος, κάθετη κλιμάκωση και παρεμβολή ιδιοτήτων ACID.
# 3) Προγνωστικό Analytics
Το Predictive Analytics προσφέρει προσαρμοσμένες πληροφορίες που οδηγούν τους οργανισμούς να δημιουργήσουν νέες απαντήσεις πελατών ή αγορές και ευκαιρίες πολλαπλών πωλήσεων. Οι οργανισμοί χρησιμοποιούν προγνωστικά αναλυτικά στοιχεία για να κάνουν προβλέψεις σε μεμονωμένα στοιχεία σε αναλυτικά επίπεδα για να προβλέψουν μελλοντικά αποτελέσματα και να αποτρέψουν πιθανά ζητήματα. Αυτό συνδυάζεται περαιτέρω με ιστορικά δεδομένα και μετατρέπεται σε προδιαγραφικά αναλυτικά στοιχεία.
Ορισμένες περιοχές όπου τα μεγάλα δεδομένα πρόβλεψης δεδομένων έχουν χρησιμοποιηθεί επιτυχώς είναι οι επιχειρήσεις, η προστασία των παιδιών, τα συστήματα υποστήριξης κλινικών αποφάσεων, η πρόβλεψη χαρτοφυλακίου, οι προβλέψεις σε επίπεδο οικονομίας και η αναδοχή.
# 4) Βαθιά μάθηση
Τα μεγάλα δεδομένα είναι συντριπτικά για τη συμβατική πληροφορική. Αποδεικνύεται ότι οι παραδοσιακές τεχνικές μηχανικής εκμάθησης της ανάλυσης δεδομένων ισοδυναμούν στην απόδοση με την αύξηση της ποικιλίας και του όγκου των δεδομένων.
Το Analytics αντιμετωπίζει προκλήσεις σε σχέση με παραλλαγές μορφής, πηγές εισόδου υψηλής κατανομής, ανισορροπημένα δεδομένα εισόδου και δεδομένα ροής που κινούνται γρήγορα και οι αλγόριθμοι Deep learning αντιμετωπίζουν αποτελεσματικά τέτοιες προκλήσεις.
Η βαθιά μάθηση έχει βρει την αποτελεσματική χρήση της στη σημασιολογική ευρετηρίαση, τη διεξαγωγή διακριτικών εργασιών, τη σημασιολογική εικόνα και την επισήμανση βίντεο, την κοινωνική στόχευση και επίσης σε ιεραρχικές προσεγγίσεις πολυεπίπεδης μάθησης στους τομείς της αναγνώρισης αντικειμένων, της προσθήκης ετικετών, της ανάκτησης πληροφοριών και της φυσικής γλώσσας επεξεργασία.
# 5) Λίμνες δεδομένων
Η αποθήκευση διαφορετικών συνόλων δεδομένων σε διαφορετικά συστήματα και ο συνδυασμός τους για ανάλυση με παραδοσιακές προσεγγίσεις διαχείρισης δεδομένων αποδεικνύονται δαπανηρές και είναι σχεδόν ανέφικτες. Επομένως, οι οργανισμοί δημιουργούν λίμνες δεδομένων, οι οποίες αποθηκεύουν δεδομένα σε ακατέργαστη, εγγενή μορφή τους για αναλυτικά στοιχεία με δυνατότητα δράσης.
Η παρακάτω εικόνα εμφανίζει ένα παράδειγμα λίμνης δεδομένων στην αρχιτεκτονική μεγάλων δεδομένων.
(εικόνα πηγή )
Μεγάλες χρήσεις ανάλυσης δεδομένων
Παραθέτουμε παρακάτω ορισμένες περιπτώσεις διαδεδομένης χρήσης:
# 1) Ανάλυση πελατών
Το Big Data Analytics είναι χρήσιμο για διάφορους σκοπούς, όπως το μικρο-μάρκετινγκ, το ένα προς ένα μάρκετινγκ, η καλύτερη τμηματοποίηση και η μαζική προσαρμογή για τους πελάτες μιας επιχείρησης. Οι επιχειρήσεις μπορούν να δημιουργήσουν στρατηγικές για να εξατομικεύσουν τα προϊόντα και τις υπηρεσίες τους σύμφωνα με τις τάσεις των πελατών να κάνουν προς πώληση ή να πωλήσουν ένα παρόμοιο ή διαφορετικό φάσμα προϊόντων και υπηρεσιών.
# 2) Ανάλυση λειτουργίας
Η λειτουργία analytics βοηθά στη βελτίωση της συνολικής λήψης αποφάσεων και των επιχειρηματικών αποτελεσμάτων, αξιοποιώντας τα υπάρχοντα δεδομένα και εμπλουτίζοντάς τα με τα μηχανήματα και τα δεδομένα IoT.
Για παράδειγμα, Η μεγάλη ανάλυση δεδομένων στην υγειονομική περίθαλψη κατέστησε δυνατή την αντιμετώπιση προκλήσεων και νέων ευκαιριών που σχετίζονται με τη βελτιστοποίηση των δαπανών για την υγειονομική περίθαλψη, τη βελτίωση της παρακολούθησης των κλινικών δοκιμών, την πρόβλεψη και τον σχεδιασμό των απαντήσεων σε επιδημίες ασθενειών όπως το COVID-19.
# 3) Πρόληψη απάτης
Τα μεγάλα αναλυτικά στοιχεία δεδομένων έχουν τη δυνατότητα να αποφέρουν τεράστια οφέλη βοηθώντας στην πρόβλεψη και τη μείωση των προσπαθειών απάτης, κυρίως στον χρηματοοικονομικό και ασφαλιστικό τομέα.
Για παράδειγμα, Οι ασφαλιστικές εταιρείες καταγράφουν δεδομένα σε πραγματικό χρόνο σχετικά με τη δημογραφία, τα κέρδη, τις ιατρικές αξιώσεις, τα έξοδα δικηγόρου, τον καιρό, τις ηχογραφήσεις ενός πελάτη και τις σημειώσεις τηλεφωνικού κέντρου. Συγκεκριμένες λεπτομέρειες σε πραγματικό χρόνο βοηθούν στη δημιουργία προγνωστικών μοντέλων συνδυάζοντας τις πληροφορίες που αναφέρονται παραπάνω με ιστορικά δεδομένα για τον εντοπισμό νωρίς εικαζόμενων δόλιων αξιώσεων.
# 4) Βελτιστοποίηση τιμών
Οι εταιρείες χρησιμοποιούν μεγάλα analytics δεδομένων για να αυξήσουν τα περιθώρια κέρδους βρίσκοντας την καλύτερη τιμή σε επίπεδο προϊόντος και όχι σε επίπεδο κατηγορίας. Οι μεγάλες εταιρείες το θεωρούν υπερβολικό για να λάβουν τις λεπτομερείς λεπτομέρειες και την πολυπλοκότητα των μεταβλητών τιμολόγησης, οι οποίες αλλάζουν τακτικά για χιλιάδες προϊόντα.
Μια στρατηγική βελτιστοποίησης τιμών με γνώμονα τα αναλυτικά στοιχεία, όπως η δυναμική βαθμολογία διαπραγμάτευσης, επιτρέπει στις εταιρείες να ορίζουν τιμές για ομάδες προϊόντων και τμημάτων με βάση τα δεδομένα τους και τις γνώσεις τους σε μεμονωμένα επίπεδα διαπραγμάτευσης για να κερδίσουν γρήγορες νίκες από απαιτητικούς πελάτες.
Συχνές Ερωτήσεις
Ε # 1) Είναι η μεγάλη ανάλυση δεδομένων καλή καριέρα;
Απάντηση: Είναι μια προστιθέμενη αξία για οποιονδήποτε οργανισμό, επιτρέποντάς του να λαμβάνει ενημερωμένες αποφάσεις και να παρέχει πλεονέκτημα έναντι των ανταγωνιστών. Μια κίνηση σταδιοδρομίας Big Data αυξάνει την πιθανότητά σας να γίνετε βασικός υπεύθυνος λήψης αποφάσεων για έναν οργανισμό.
Ε # 2) Γιατί είναι σημαντικό το μεγάλο analytics δεδομένων;
Απάντηση: Βοηθά τους οργανισμούς να δημιουργήσουν νέες ευκαιρίες ανάπτυξης και εντελώς νέες κατηγορίες προϊόντων που μπορούν να συνδυάσουν και να αναλύσουν τα δεδομένα της βιομηχανίας. Αυτές οι εταιρείες έχουν άφθονες πληροφορίες σχετικά με τα προϊόντα και τις υπηρεσίες, τους αγοραστές και τους προμηθευτές, τις προτιμήσεις των καταναλωτών που μπορούν να αποτυπωθούν και να αναλυθούν.
Q # 3) Τι απαιτείται για τα μεγάλα αναλυτικά δεδομένα;
Απάντηση: Το φάσμα των τεχνολογιών που ένας καλός αναλυτής δεδομένων πρέπει να γνωρίζει είναι τεράστιο. Για να αποκτήσει κανείς το Big Data analytics, απαιτεί κατανόηση διαφόρων εργαλείων, λογισμικού, υλικού και πλατφορμών. Για παράδειγμα, Τα υπολογιστικά φύλλα, τα ερωτήματα SQL και το R / R Studio και το Python είναι μερικά βασικά εργαλεία.
Σε επίπεδο επιχείρησης, εργαλεία όπως τα MATLAB, SPSS, SAS και Congnos είναι σημαντικά επιπλέον των Linux, Hadoop, Java, Scala, Python, Spark, Hadoop και HIVE.
Αντικειμενικές ερωτήσεις:
Q # 4) Ποιες από τις βάσεις δεδομένων που δίνονται παρακάτω δεν είναι βάση δεδομένων NoSQL;
- MongoDB
- PostgreSQL
- CouchDB
- HBase
Απάντηση: PostgreSQL
Ε # 5) Είναι η Κασσάνδρα NoSQL;
- Αληθής
- Ψευδής
Απάντηση: Αληθής
Q # 6) Ποιο από τα παρακάτω δεν είναι ιδιοκτησία του Hadoop;
Γενικά, τα περισσότερα σφάλματα (ελαττώματα) βρίσκονται σε ποιες δύο περιόδους δοκιμών;
- Ανοιχτή πηγή
- Βασίζεται σε Java
- Κατανεμημένη επεξεργασία
- Πραγματικός χρόνος
Απάντηση: Πραγματικός χρόνος
Ε # 7) Επιλέξτε όλες τις δραστηριότητες που ΔΕΝ εκτελούνται από έναν Επιστήμονα Δεδομένων.
- Δημιουργήστε μοντέλα Machine Learning και βελτιώστε την απόδοσή τους.
- Αξιολόγηση στατιστικών μοντέλων για επικύρωση αναλύσεων
- Συνοψίστε τις προηγμένες αναλύσεις χρησιμοποιώντας εργαλεία οπτικοποίησης δεδομένων
- Παρουσίαση των αποτελεσμάτων της τεχνικής ανάλυσης σε εσωτερικές ομάδες και επιχειρηματικούς πελάτες
Απάντηση: Παρουσίαση των αποτελεσμάτων της τεχνικής ανάλυσης σε εσωτερικές ομάδες και επιχειρηματικούς πελάτες
Περαιτέρω ανάγνωση = >> Βασικές διαφορές μεταξύ αναλυτή δεδομένων και επιστημόνων δεδομένων
Ε # 8) Ποιες δραστηριότητες εκτελούνται από έναν Αναλυτή Δεδομένων;
- Καθαρίστε και οργανώστε ανεπεξέργαστα δεδομένα
- Εύρεση ενδιαφέρων τάσεων στα δεδομένα
- δημιουργήστε πίνακες εργαλείων και απεικονίσεις για εύκολη ερμηνεία
- Ολα τα παραπανω
Απάντηση: Ολα τα παραπανω
Ε # 9) Ποιο από τα παρακάτω εκτελείται από έναν Μηχανικό Δεδομένων;
- Ενσωμάτωση νέων πηγών δεδομένων στον υπάρχοντα αγωγό ανάλυσης δεδομένων
- Η ανάπτυξη API για κατανάλωση δεδομένων
- παρακολούθηση και δοκιμή του συστήματος για συνεχή απόδοση
- Ολα τα παραπανω
Απάντηση: Ολα τα παραπανω
Ε # 10) Η σωστή ακολουθία ροής δεδομένων για αναλυτικά είναι
- Πηγές δεδομένων, προετοιμασία δεδομένων, μετασχηματισμός δεδομένων, σχεδίαση αλγορίθμου, ανάλυση δεδομένων
- Πηγές δεδομένων, Μετασχηματισμός δεδομένων, Σχεδιασμός αλγορίθμου, Προετοιμασία δεδομένων, Ανάλυση δεδομένων
- Πηγές δεδομένων, Σχεδιασμός αλγορίθμου, Προετοιμασία δεδομένων, Μετασχηματισμός δεδομένων, Ανάλυση δεδομένων
- Πηγές δεδομένων, Προετοιμασία δεδομένων, Σχεδιασμός αλγορίθμου, Μετασχηματισμός δεδομένων, Ανάλυση δεδομένων
Απάντηση: Πηγές δεδομένων, προετοιμασία δεδομένων, μετασχηματισμός δεδομένων, σχεδίαση αλγορίθμου, ανάλυση δεδομένων
Ε # 11) Η Ανάλυση Δεδομένων είναι μια γραμμική διαδικασία.
- Αληθής
- Ψευδής
Απάντηση: Ψευδής
Ε # 12) Η διερευνητική ανάλυση ΔΕΝ είναι
- Απάντηση αρχικές ερωτήσεις ανάλυσης δεδομένων λεπτομερώς
- Προσδιορίστε προβλήματα με το σύνολο δεδομένων
- Αναπτύξτε ένα σκίτσο μιας απάντησης στην ερώτηση
- Προσδιορίστε αν τα δεδομένα είναι σωστά για την απάντηση σε μια ερώτηση
Απάντηση: Απάντησηαρχικές ερωτήσεις ανάλυσης δεδομένων λεπτομερώς
Ε # 13) Η ερώτηση πρόβλεψης είναι ένα άλλο όνομα που δίνεται σε μια ερώτηση Inferential.
- Αληθής
- Ψευδής
Απάντηση: Ψευδής
συμπέρασμα
Καλύψαμε τις πιο σημαντικές πτυχές της μεγάλης ανάλυσης δεδομένων. Εξηγήσαμε τις πιο διαδεδομένες περιπτώσεις χρήσης και τις τάσεις στη μεγάλη βιομηχανία ανάλυσης δεδομένων για να αποκομίσουμε τα μέγιστα οφέλη.
Συνιστώμενη ανάγνωση
- Κορυφαίες 7 καλύτερες εταιρείες ανάλυσης δεδομένων το 2021 (Ενημερωμένη λίστα 2021)
- Top 15 Big Data Tools (Big Data Analytics Tools) το 2021
- 10 καλύτερα εργαλεία ανάλυσης δεδομένων για τέλεια διαχείριση δεδομένων (2021 LIST)
- Top 10 Εργαλεία Επιστήμης Δεδομένων το 2021 για την εξάλειψη του προγραμματισμού
- Big Data Tutorial για αρχάριους | Τι είναι τα Big Data;
- Κορυφαίες 13 καλύτερες εταιρείες Big Data του 2021
- 10 καλύτερα εργαλεία μοντελοποίησης δεδομένων για τη διαχείριση σύνθετων σχεδίων
- 10+ καλύτερα εργαλεία διαχείρισης δεδομένων για την κάλυψη των αναγκών δεδομένων σας το 2021