Apache Flink

Informations
Développé par	Apache Software Foundation
Première version	6 janvier 2015
Dernière version	1.20.0 (1er août 2024)
Dépôt	github.com/apache/flink
Écrit en	Java et Scala
Environnement	Machine virtuelle Java
Type	Big data
Licence	Licence Apache 2.0
Site web	flink.apache.org

Cet article est une ébauche concernant l’informatique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Apache Flink est un framework open source de traitement flux développé par la Apache Software Foundation. Le noyau d'Apache Flink est un moteur distribué de flux écrit en Java et en Scala^[3]^,^[4]. Flink exécute des programmes de flux de données arbitraires de manière parallèle et en pipeline^[5]. Le système d'exécution en pipeline de Flink permet l'exécution de programmes de traitement en bloc / par lots et de flux^[6]^,^[7]. En outre, le runtime de Flink prend en charge l'exécution d'algorithmes itératifs de manière native^[8].

Flink fournit un moteur de diffusion en continu à haut débit et à faible temps de latence , ainsi qu'un support pour le traitement des événements et la gestion de l'état. Les applications Flink sont tolérantes aux pannes en cas de défaillance de la machine et prennent en charge une sémantique exacte^[9]. Les programmes peuvent être écrits en Java , Scala^[10], Python^[11], et SQL ^[12]. Ils sont automatiquement compilés et optimisés ^[13] dans des programmes de flux de données exécutés dans un cluster ou un environnement en nuage^[14].

Flink ne fournit pas son propre système de stockage de données, mais fournit des connecteurs de source et de données aux systèmes tels que Amazon Kinesis , Apache Kafka , Alluxio , HDFS , Apache Cassandra et Elasticsearch^[15].

Articles connexes

Liens externes

Site officiel

Références

↑ « https://projects.apache.org/json/projects/flink.json » (consulté le 8 avril 2020)
↑ « Release 1.20.0 », 1^er août 2024 (consulté le 20 août 2024)
↑ « Apache Flink: Scalable Batch and Stream Data Processing », apache.org
↑ « apache/flink », GitHub
↑ Alexander Alexandrov, Rico Bergmann, Stephan Ewen, Johann-Christoph Freytag, Fabian Hueske, Arvid Heise, Odej Kao, Marcus Leich, Ulf Leser, Ulf Leser, Felix Naumann, Mathias Peters et Astrid Rheinländer, Matthias J. Sax Höger, Kostas Tzoumas et Daniel Warneke. 2014. La plate-forme Stratosphere pour l'analyse de données volumineuses . The VLDB Journal 23, 6 (décembre 2014), 939-964. EST CE QUE JE
↑ Ian Pointer, « Apache Flink: New Hadoop contender squares off against Spark », InfoWorld, 7 mai 2015
↑ « On Apache Flink. Interview with Volker Markl. », odbms.org
↑ Stephan Ewen, Kostas Tzoumas, Moritz Kaufmann et Volker Markl. 2012. Flux de données itératifs rapides . Proc. VLDB Endow. 5, 11 (juillet 2012), 1268-1279. EST CE QUE JE
↑ (en) Paris Carbone, Gyula Fóra, Stephan Ewen, Seif Haridi et Kostas Tzoumas, « Lightweight Asynchronous Snapshots for Distributed Dataflows », 2015.
↑ (en) « Apache Flink 1.2.0 Documentation: Flink DataStream API Programming Guide », ci.apache.org (consulté le 23 février 2017)
↑ (en) « Apache Flink 1.2.0 Documentation: Python Programming Guide », ci.apache.org (consulté le 23 février 2017)
↑ (en) « Apache Flink 1.2.0 Documentation: Table and SQL », ci.apache.org (consulté le 23 février 2017)
↑ Fabian Hueske, Mathias Peters, Matthias J. Sax, Astrid Rheinländer, Rico Bergmann, Aljoscha Krettek et Kostas Tzoumas. 2012. Ouverture des boîtes noires dans l'optimisation des flux de données . Proc. VLDB Endow. 5, 11 (juillet 2012), 1256-1267. EST CE QUE JE
↑ Daniel Warneke et Odej Kao. 2009. Nephele: traitement de données parallèle efficace dans le cloud . Dans Actes du deuxième atelier sur l'informatique à plusieurs tâches sur les grilles et les super-ordinateurs (MTAGS '09). ACM, New York, NY, États-Unis d’Amérique, article 8, 10 pages. EST CE QUE JE
↑ (en) « Apache Flink 1.2.0 Documentation: Streaming Connectors », ci.apache.org (consulté le 23 février 2017)

[wikidata-b60fba59e18b49a9cdcdbd7ae8661609a581c85c-1] « https://projects.apache.org/json/projects/flink.json » (consulté le 8 avril 2020)

[wikidata-b699a657a2100c58420b67d80b58e7b93ad097b6-2] « Release 1.20.0 », 1^er août 2024 (consulté le 20 août 2024)

[3] « Apache Flink: Scalable Batch and Stream Data Processing », apache.org

[4] « apache/flink », GitHub

[5] Alexander Alexandrov, Rico Bergmann, Stephan Ewen, Johann-Christoph Freytag, Fabian Hueske, Arvid Heise, Odej Kao, Marcus Leich, Ulf Leser, Ulf Leser, Felix Naumann, Mathias Peters et Astrid Rheinländer, Matthias J. Sax Höger, Kostas Tzoumas et Daniel Warneke. 2014. La plate-forme Stratosphere pour l'analyse de données volumineuses . The VLDB Journal 23, 6 (décembre 2014), 939-964. EST CE QUE JE

[6] Ian Pointer, « Apache Flink: New Hadoop contender squares off against Spark », InfoWorld, 7 mai 2015

[7] « On Apache Flink. Interview with Volker Markl. », odbms.org

[8] Stephan Ewen, Kostas Tzoumas, Moritz Kaufmann et Volker Markl. 2012. Flux de données itératifs rapides . Proc. VLDB Endow. 5, 11 (juillet 2012), 1268-1279. EST CE QUE JE

[:2-9] (en) Paris Carbone, Gyula Fóra, Stephan Ewen, Seif Haridi et Kostas Tzoumas, « Lightweight Asynchronous Snapshots for Distributed Dataflows », 2015.

[10] (en) « Apache Flink 1.2.0 Documentation: Flink DataStream API Programming Guide », ci.apache.org (consulté le 23 février 2017)

[11] (en) « Apache Flink 1.2.0 Documentation: Python Programming Guide », ci.apache.org (consulté le 23 février 2017)

[12] (en) « Apache Flink 1.2.0 Documentation: Table and SQL », ci.apache.org (consulté le 23 février 2017)

[13] Fabian Hueske, Mathias Peters, Matthias J. Sax, Astrid Rheinländer, Rico Bergmann, Aljoscha Krettek et Kostas Tzoumas. 2012. Ouverture des boîtes noires dans l'optimisation des flux de données . Proc. VLDB Endow. 5, 11 (juillet 2012), 1256-1267. EST CE QUE JE

[14] Daniel Warneke et Odej Kao. 2009. Nephele: traitement de données parallèle efficace dans le cloud . Dans Actes du deuxième atelier sur l'informatique à plusieurs tâches sur les grilles et les super-ordinateurs (MTAGS '09). ACM, New York, NY, États-Unis d’Amérique, article 8, 10 pages. EST CE QUE JE

[:0-15] (en) « Apache Flink 1.2.0 Documentation: Streaming Connectors », ci.apache.org (consulté le 23 février 2017)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

v · m Science des données
Concepts	MapReduce Apprentissage profond Extreme learning machine Apprentissage automatique Apprentissage supervisé Apprentissage non supervisé Réseau de neurones artificiels Visualisation de données Exploration de données Textemining Segmentation Intelligence artificielle Big data Data lineage
Architecture	Hadoop Cloudera Hortonworks Apache Hive NoSQL NewSQL HBase Cassandra Apache Spark
Outils	Presto Apache Impala Pig Tableau Software Elasticsearch MongoDB Apache Mahout Scikit-learn TensorFlow Theano (logiciel) SPSS JMP Dataiku Apache MXNet ONNX Apache SINGA Keras
Programmation	R Ggplot2 SAS Python Julia SQL Scala
Statistique	ACP AFC ACM Méthode des moindres carrés Analyse des données Homoscédasticité Knn Cartes de Kohonen Statistique multivariée Théorème de Bayes Analyse de la variance Test du χ² Distance de Cook
Articles liés	Watson Teradata Glossaire de l'exploration de données Extract-transform-load Traitement analytique en ligne