Tensor flow यह एक मशीन लर्निंग टूल है जिसे google ने बनाया है ।

Python एक प्रोग्रामिंग भाषा है जो हर डाटा साइंटिस्ट को आनी चाहिए ।

Jupyter notebook एक एप्लीकेशन है जिसमे आप live code, equations, visualizations और narrative text आदि कार्य कर सकते हो ।

R एक कंप्यूटर और ग्राफिक्स को बनाने की एक भाषा है जिसको आना बहुत जरूरी है ।

Rstudio R के लिए एक integrated development environment प्रदान करता है ।

SQL relational databases को प्रबंधित करने और querying के लिए आवश्यक है ।

Apache Hadoop इसका उपयोग बड़े डाटा बेस को distributed storage और प्रोसेसिंग के लिए किया जाता है ।

Apache Spark एक क्लस्टर कंप्यूटर प्रणाली है जो बड़े डाटा को प्रोसेस और मशीन लर्निंग में उपयोग होती है ।

Scikit learn मशीन लर्निंग के लिए पायथन लाइब्रेरी है जो डाटा माइनिंग के लिए उपकरण प्रदान करता है ।

Kaggle यह कोई टूल नही यह एक प्लेटफॉर्म है जिसमे मशीन लर्निंग से जुड़े लोग इसमें अपना योगदान देते है ।