[Nouveautés] KNIME Analytics Platform 4.6.0 et KNIME Server 4.15
KNIME Analytics platform :Une interface utilisateur plus élégante, de meilleures capacités de script Python, de nouveaux nœuds de visualisation et une intégration Snowflake améliorée.
Découvrez les points forts:
- Aperçu de l’interface utilisateur moderne de KNIME (Laboratoires)
- Nouveaux nœuds de visualisation dans KNIME (Labs)
- Environnement Python fourni
- Nœuds KNIME en Python pur (Laboratoires)
- Modèle d’apprentissage automatique Snowflake H2O
Découvrez les améliorations :
- Améliorations de la structure de base de données
- Services Microsoft Azure
- Expression de colonne et formules multilignes
- XGBoost
- Prise en charge étendue des étincelles
Les points forts :
Aperçu de l’interface utilisateur moderne de KNIME (Laboratoires)
KNIME Analytics Platform fait peau neuve. Cette version inclut une extension qui prévisualise la nouvelle interface.
Les plus grands changements que vous trouverez jusqu’à présent :
- L’aspect et la sensation améliorés.
- Le référentiel de nœuds dispose désormais de fonctionnalités de filtrage et de recherche avancées. Les nœuds sont également affichés dans le référentiel comme ils le sont dans le workflow, avec les ports par défaut.
- Un nouveau fil d’Ariane de flux de travail qui permet aux utilisateurs de parcourir le contenu de leur flux de travail.
Cette extension est considérée comme une préversion et est actuellement en cours de développement. KNIME tient à vous offrir une meilleure expérience utilisateur. Pour des informations techniques détaillées, lisez la documentation.
Nouveaux nœuds de visualisation dans KNIME (Labs)
De tout nouveaux nœuds de visualisation pour explorer les données et créer des applications de données sont disponibles en aperçu dans l’ extension KNIME Views (Labs) . Ces nœuds remplacent les quatre nœuds de visualisation précédents et offrent une expérience plus cohérente. KNIME prévoit d’en remplacer encore plus, suite aux commentaires de la communauté.
Les principales fonctionnalités incluent :
- Un aperçu en direct de la visualisation à côté de la boîte de dialogue de configuration.
- Les descriptions des nœuds sont désormais affichées à côté de la boîte de dialogue des paramètres.
- Tous les paramètres contrôlés par des variables de débit sont affichés et automatiquement indiqués par une icône.
Environnement Python fourni
KNIME continue d’améliorer l’expérience des scripteurs Python. L’extension KNIME Python (Labs) contient désormais son propre environnement Python afin que vous puissiez commencer immédiatement avec les scripts Python dans KNIME – aucune installation de logiciel supplémentaire n’est nécessaire.
Pour la configuration, il existe une nouvelle page de préférences Python (Labs) qui vous permet de choisir la nouvelle option « Bundled », ou l’environnement Python « Conda » ou « Manual » précédemment disponible. Pour une liste complète des packages Python inclus, consultez la documentation.
Nœuds KNIME en Python pur (Laboratoires)
Cette version marque la première fois que les nœuds KNIME peuvent être entièrement écrits en Python et peuvent être partagés au sein d’équipes, tout comme les autres extensions KNIME. Cela inclut la configuration et l’exécution des nœuds ainsi que la définition des dialogues et les vues des nœuds.
Pour vous aider à concevoir ces nœuds, KNIME introduit une API Pythonic et des capacités de débogage. En outre, KNIME fournit les moyens de déployer des nœuds en Python pur, y compris leur environnement Python nécessaire à l’exécution, à l’aide d’un site de mise à jour construit localement. Voir un exemple simple pour définir un nœud KNIME à part entière dans cette vidéo de démonstration .
Voir ce tutoriel ainsi que la documentation de l’API ici .
Modèle d’apprentissage automatique Snowflake H2O
Les utilisateurs professionnels ayant peu ou pas d’expérience en codage (SQL ou autre) ont pu obtenir des informations sur les données Snowflake à l’aide de l’interface intuitive low-code/no-code de KNIME. Avec cette dernière version, KNIME Analytics Platform prend désormais en charge le push-down des modèles H2O directement dans Snowflake. Cela signifie que les utilisateurs peuvent désormais créer des modèles d’apprentissage automatique à l’aide des données Snowflake, puis même exécuter ces modèles dans Snowflake. Cela vous permet d’obtenir des prédictions sur de grandes quantités de données en quelques secondes, car les données restent dans Snowflake.
Pour un exemple de flux de travail, consultez cet article de blog.
Les points d’améliorations :
Améliorations de la structure de base de données
Avec le cadre de base de données KNIME , vous pouvez utiliser la puissance de traitement de votre base de données en poussant l’exécution là où résident les données, le tout en créant visuellement des instructions SQL dans KNIME.
Tout d’abord, KNIME a amélioré la connectivité en utilisant le framework de base de données KNIME :
- Démarrer avec Oracle Databases est maintenant beaucoup plus facile car tous les pilotes de base de données requis sont intégrés et KNIME prend désormais en charge l’authentification basée sur Kerberos sur le serveur KNIME.
- Les pilotes intégrés sont mis à jour pour une sécurité améliorée et des fonctionnalités supplémentaires pour Amazon Redshift, H2, Microsoft Access, MySQL, PostgreSQL, SQLite.
De plus, en fonction des demandes les plus fréquentes, KNIME a étendu les fonctionnalités de requête visuelle et de manipulation de données avec quatre nouveaux nœuds de base de données :
- Le nœud DB Concatenate facilite la concaténation de n’importe quel nombre de requêtes de base de données en une seule requête.
- Le nœud DB Looping prend en charge les requêtes qui correspondent à n’importe quelle valeur dans une liste de valeurs d’entrée (par exemple, les requêtes IN).
- Le nœud DB Delete (Filter) vous permet de spécifier des critères de filtre pour identifier les lignes qui doivent être supprimées d’une table de base de données.
- Enfin, le nœud DB Data Spec Extractor extrait la spécification de la table de base de données dans une table KNIME vous permettant d’utiliser ces informations dans votre analyse.
Avec le nœud DB Looping, KNIME a migré le dernier nœud du framework de base de données hérité . Avec la prochaine version, KNIME rend obsolète l’infrastructure de base de données héritée. Si vous utilisez toujours des nœuds de base de données hérités, il est maintenant temps de migrer vers l’infrastructure actuelle.
Pour plus d’informations sur le framework ou la migration, consultez le Guide d’extension de la base de données KNIME .
Services Microsoft Azure
KNIME Analytics Platform vous permet d’accéder de manière transparente à divers services Microsoft Azure. Avec cette version, vous pouvez désormais interagir visuellement avec des pools SQL sans serveur et dédiés sur Azure Synapse Analytics sans avoir à écrire d’instructions SQL à l’aide de l’ infrastructure de base de données KNIME .
- Utilisez le nœud Microsoft SQL Server Connector étendu pour vous connecter à ces pools et effectuer un téléchargement de données à haut débit via le nœud DB Loader .
- Utilisez l’infrastructure de gestion de fichiers KNIME pour gérer vos fichiers de données dans les comptes de stockage Azure Synapse.
Cette version étend également l’intégration de SharePoint Online en ajoutant la prise en charge de la création de nouvelles listes ou de la suppression de listes existantes. Enfin, le nœud d’authentification Microsoft a été étendu pour prendre en charge les ID d’application personnalisés et les points de terminaison d’autorisation afin de répondre à vos exigences de sécurité.
Expression de colonne et formules multilignes
Column Expressions est un outil polyvalent pour calculer de nouvelles colonnes basées sur des expressions simples. Bien qu’auparavant limité à la dérivation de ces nouvelles valeurs à partir de la ligne actuelle, une nouvelle colonne de fonction (nom, décalage) a été ajoutée pour lire les valeurs des lignes précédentes et suivantes, permettant ainsi des formules à plusieurs lignes (trouver un exemple sur KNIME Hub ).
De plus, de nouvelles fonctions et capacités facilitent la manipulation et la création de cellules de chemin et désormais également de variables dans KNIME Analytics Platform. De nouvelles fonctions pour créer des variables et des cellules de système de fichiers standard vous permettent de créer de nouveaux chemins directement dans les nœuds.
XGBoost
L’intégration XGBoost sort enfin des laboratoires avec trois mises à jour principales :
- Les poids des lignes vous permettent de contrôler le poids que les apprenants attribuent aux lignes individuelles de votre ensemble de données. Cela peut être très utile pour remédier aux déséquilibres de classe ou pour hiérarchiser certains sous-ensembles de vos données.
- La prise en charge des vecteurs de bits et d’octets améliore l’applicabilité des nœuds dans des domaines tels que le traitement de texte ou les sciences de la vie où il est courant d’avoir une représentation vectorielle des données
- La sortie d’importance des fonctionnalités des nœuds XGBoost Tree Ensemble Learner est un tableau de sortie qui vous fournit diverses mesures indiquant l’importance de chaque fonctionnalité pour le modèle appris.
Pour voir des exemples de flux de travail illustrant cette fonctionnalité, visitez le KNIME Hub .
Prise en charge étendue des étincelles
KNIME a ajouté la prise en charge de Spark 3.1 et 3.2, y compris la prise en charge de H2O Sparkling Water. La création d’un environnement Big Data local , qui crée un environnement Big Data entièrement fonctionnel pour les tests et le prototypage local, utilise désormais Spark 3.2.
Réinitialiser les workflows sur le serveur KNIME
Il est désormais possible de réinitialiser les flux de travail stockés sur le serveur KNIME directement à partir de l’explorateur KNIME sans ouvrir le flux de travail au préalable. Cette nouvelle fonctionnalité fera gagner beaucoup de temps aux utilisateurs, en particulier lorsqu’ils traitent des flux de travail qui téléchargent une grande quantité de données.
Pour aller plus loin !
Vous souhaitez voir notre dernier article sur notre partenaire KNIME ? Apprenez comment combiner, grâce aux fonctionnalités du logiciel, nos 36 feuilles en une seule.
Découvrez notre How to sur « Comment combiner plusieurs feuilles Excel sur KNIME ? »
Author Profile
- Louis Lutz est chargé de projets en Marketing & Data Analyst, avec une aspiration naturelle dans l’univers de la data. Son expertise s'étend à la gestion et mise en place de projets marketing jusqu’à l'analyse de données. Au sein de Mydral, Louis se consacre à l'optimisation des campagnes menés par les départements, à la génération de leads qualifiés et à l'amélioration continue des performances marketing afin de maximiser l'impact et l'efficacité des actions entreprises.
Latest entries
- Actualités2 juillet 2024Tableau Performance Management : Un pas vers l’optimisation de vos actifs Tableau
- Actualités13 novembre 2023[Nouveautés] Tableau 2023.3 – Découvrez la version !
- Actualités23 octobre 2023[Replay] – Introduction à l’analytique embarquée
- Actualités29 septembre 2023Retour en images : Salon du Big Data Paris 2023