孙金城(金竹)

孙金城(金竹)

Apache Flink PMC

一名与代码一起形影不离的渡过了近14年的码农,每天的工作由被高年级同学指点,到独立完成代码开发,到逐渐辅导新同学,到带团队完成基础组件和平台服务的架构开发,到现在作为Apache Beam,Apache Flink 和 Apache IoTDB多个项目Committer和PMC成员,以及Apache 软件基金会成员,目前在参与和主导Apache 顶级项目的健康发展的同时,也喜欢写一些大数据、尤其是与Apache Flink相关的技术博客和视频课程。这些年经历下来,最想和大家分享的一句话是:“莫向外求,修内达人,走对了路,就不怕路的遥远!"
Flink 生态:一个案例快速上手 PyFlink
Flink 生态:一个案例快速上手 PyFlink

Flink 从 1.9.0 版本开始增加了对 Python 的支持(PyFlink),在刚刚发布的 Flink 1.10 中,PyFlink 添加了对 Python UDFs 的支持,现在可以在 Table API/SQL 中注册并使用自定义函数。PyFlink 的架构如何,适用于哪些场景?本文将详细解析并进行 CDN 日志分析的案例演示。

PyFlink 作业的多种部署模式
PyFlink 作业的多种部署模式

关于 PyFlink 的博客我们曾介绍过 PyFlink 的功能开发,比如,如何使用各种算子(Join/Window/AGG etc.),如何使用各种 Connector(Kafka, CSV, Socket etc.),还有一些实际的案例。这些都停留在开发阶段,一旦开发完成,我们就面临激动人心的时刻,那就是将我们精心设计开发的作业进行部署,那么问题来了,你知道怎样部署 PyFlink 的作业吗?

Apache Flink 1.9.0 为什么将支持 Python API ?
Apache Flink 1.9.0 为什么将支持 Python API ?

原文链接:https://enjoyment.cool/2019/07/21/Apache%20Flink%20%E8%AF%B4%E9%81%93%E7%B3%BB%E5%88%97-%20Python%20API%20%E6%97%B6%E4%BB%A3%E7%9A%84%E4%BA%A7%E7%89%A9/#moreSpacer

Apache Flink SQL概览
Apache Flink SQL概览

(https://github.com/sunjincheng121/flink-study/blob/test/docs/sql/SQL.md)本篇核心目标是让大家概要了解一个完整的Apache Flink SQL Job的组成部分,以及Apache Flink SQL所提供的核心算子的语义,最后会应用TumbleWindow编写一个End-to-End的页面访问的统计示例。

  • 关注
    • qr_code

      微信公众号

      最新前沿最热资讯

    • qr_code

      技术支持钉钉群

      时时刻刻得到帮助

  • TOP