Ανάλυση δεδομένων με Python (Numpy, Pandas, Matplotlib, Seaborn)

easystudy.gr
Τελευταία Ενημέρωση 22/01/2023
0 μαθητές έχουν ήδη εγγραφεί

Περιγραφή Μαθήματος

Η Ανάλυση δεδομένων με Python είναι ένα ισχυρό εργαλείο για την εξερεύνηση, την ανάλυση και την οπτικοποίηση δεδομένων. Οι κύριες βιβλιοθήκες που χρησιμοποιούνται για το σκοπό αυτό είναι οι Numpy, Pandas, Matplotlib και Seaborn.

Η Numpy είναι μια βιβλιοθήκη για τη γλώσσα προγραμματισμού Python, η οποία προσθέτει υποστήριξη για μεγάλους, πολυδιάστατους πίνακες και πίνακες, μαζί με μια μεγάλη συλλογή μαθηματικών συναρτήσεων υψηλού επιπέδου για τη λειτουργία αυτών των πινάκων.

Το Pandas είναι μια βιβλιοθήκη που παρέχει υψηλής απόδοσης, εύχρηστες δομές δεδομένων και εργαλεία ανάλυσης δεδομένων για τη γλώσσα προγραμματισμού Python. Επιτρέπει τη γρήγορη επεξεργασία και προετοιμασία δεδομένων.

Η Matplotlib είναι μια βιβλιοθήκη γραφικών παραστάσεων για τη γλώσσα προγραμματισμού Python και την αριθμητική μαθηματική επέκταση NumPy. Παρέχει ένα αντικειμενοστραφές API για την ενσωμάτωση γραφικών παραστάσεων σε εφαρμογές που χρησιμοποιούν εργαλειοθήκες GUI γενικού σκοπού όπως το Tkinter, το wxPython, το Qt ή το GTK.

Το Seaborn είναι μια βιβλιοθήκη οπτικοποίησης δεδομένων Python που βασίζεται στην Matplotlib. Παρέχει μια διεπαφή υψηλού επιπέδου για τη σχεδίαση ελκυστικών και κατατοπιστικών στατιστικών γραφικών.

Μαζί, αυτές οι βιβλιοθήκες παρέχουν ένα ολοκληρωμένο και αποτελεσματικό σύνολο εργαλείων για την ανάλυση και οπτικοποίηση δεδομένων στην Python, καθιστώντας την μια δημοφιλή επιλογή μεταξύ των επιστημόνων και αναλυτών δεδομένων.

Περιεχόμενα μαθήματος Ανάλυση δεδομένων με Python (Numpy, Pandas, Matplotlib, Seaborn)

Μέρος 1: Εισαγωγή Τι είναι η Ανάλυση Δεδομένων, γιατί Python, ποιες άλλες επιλογές υπάρχουν, ποιος είναι ο κύκλος ενός έργου Ανάλυσης Δεδομένων; Ποια είναι η διαφορά μεταξύ της Ανάλυσης Δεδομένων και της Επιστήμης Δεδομένων; 🔗 Διαφάνειες για αυτή την ενότητα

Μέρος 2: Παράδειγμα πραγματικής ζωής ενός έργου ανάλυσης δεδομένων με Python/Pandas (00:11:11) Επίδειξη ενός πραγματικού έργου ανάλυσης δεδομένων με χρήση των Python, Pandas, SQL και Seaborn. Μην ανησυχείτε, θα εμβαθύνουμε στις επόμενες ενότητες 🔗 Σημειωματάρια:

Μέρος 3: Jupyter Notebooks Tutorial (00:30:50) Ένα βήμα προς βήμα σεμινάριο για να μάθετε πώς να χρησιμοποιείτε τα Juptyer Notebooks  🔗 Σημειωματάρια:

Μέρος 4: Εισαγωγή στην NumPy (01:04:58) Μάθετε γιατί η NumPy ήταν μια τόσο σημαντική βιβλιοθήκη για τον κόσμο της επεξεργασίας δεδομένων στην Python. Μάθετε για τις λεπτομέρειες χαμηλού επιπέδου των υπολογισμών και της αποθήκευσης μνήμης και γιατί εργαλεία όπως το Excel θα είναι πάντα περιορισμένα όταν επεξεργάζονται μεγάλο όγκο δεδομένων. 🔗 Σημειωματάρια:

Μέρος 5: Εισαγωγή στην Pandas (01:57:08) Η Pandas είναι αναμφισβήτητα η πιο σημαντική βιβλιοθήκη για την Επεξεργασία Δεδομένων στον κόσμο της Python. Μάθετε πώς λειτουργεί και πώς η κύρια δομή δεδομένων της, το Data Frame, συγκρίνεται με άλλα εργαλεία όπως τα λογιστικά φύλλα ή τα DFs που χρησιμοποιούνται για Big Data 🔗 Σημειωματάρια:

Μέρος 6: Καθαρισμός δεδομένων (02:47:18) Μάθετε τους διαφορετικούς τύπους προβλημάτων που θα αντιμετωπίσουμε με τα δεδομένα μας: μηδενικές τιμές, άκυρες τιμές, στατιστικές ακραίες τιμές κ.λπ. και πώς να τα καθαρίσετε. 🔗 Σημειωματάρια:

Μέρος 7: Ανάγνωση δεδομένων από άλλες πηγές (03:25:15) 🔗 Σημειωματάρια

Μέρος 8: Αν οι δεξιότητές σας στην Python ή στον προγραμματισμό είναι σκουριασμένες, δείτε αυτό το τμήμα για μια γρήγορη ανακεφαλαίωση των κύριων χαρακτηριστικών της Python και των δομών ροής ελέγχου. 🔗 Σημειωματάρια

Διαβάστε επίσης το άρθρο μας R vs Python. Ποια γλώσσα προγραμματισμού είναι η καλύτερη;

copyright freecodecamp

Στόχοι Μάθησης

Σε αυτό το σεμινάριο θα μάθετε όλη τη διαδικασία της Ανάλυσης Δεδομένων: ανάγνωση δεδομένων από πολλαπλές πηγές (CSVs, SQL, Excel κ.λπ.), επεξεργασία τους με τη χρήση NumPy και Pandas, οπτικοποίηση τους με τη χρήση Matplotlib και Seaborn και καθαρισμός και επεξεργασία τους για τη δημιουργία αναφορών.
Επιπλέον, έχουμε συμπεριλάβει ένα εμπεριστατωμένο σεμινάριο για το Jupyter Notebook και μια γρήγορη αναφορά στην Python για να ανανεώσετε τις προγραμματιστικές σας δεξιότητες.

Στοχευμένο κοινό

  • Όλα τα επίπεδα

Πρόγραμμα σπουδών

1 Lesson4ώρες 22λεπτά

Σεμινάριο

Ανάλυση δεδομένων με Python04:22:12

Οι Εκπαιδευτές Σας

easystudy.gr

0/5
Μαθήματα 4
0 Σχόλια
1 Student
Δείτε περισσότερα

Γράψτε μια κριτική

Ανάλυση δεδομένων με Python
Δωρεάν
Επίπεδο
Όλα Τα Επίπεδα
Διάρκεια 4.4 ώρες
Διαλέξεις
1 lecture
Γλώσσα
Ελληνικά

Θέλετε να λάβετε τα push notifications για όλες τις σημαντικές δραστηριότητες;