返回介绍

流连接器

发布于 2025-05-02 18:19:14 字数 2173 浏览 0 评论 0 收藏

预定义的源和接收器

Flink 内置了一些基本数据源和接收器,并且始终可用。该 预定义的数据源 包括文件,目录和插座读书,并从摄取集合和迭代器的数据。该 预定义的数据接收器 支持写入文件,以输出和错误,并插槽。

捆绑连接器

连接器提供用于与各种第三方系统连接的代码。目前支持这些系统:

  • Apache Kafka (源/汇)
  • Apache Cassandra (接收器)
  • 亚马逊 Kinesis Streams (源/汇)
  • Elasticsearch (接收器)
  • Hadoop 文件系统 (接收器)
  • RabbitMQ (源/汇)
  • Apache NiFi (源/汇)
  • Twitter Streaming API (来源)

请记住,要在应用程序中使用其中一个连接器,通常需要其他第三方组件,例如数据存储或消息队列的服务器。另请注意,虽然本节中列出的流连接器是 Flink 项目的一部分,并且包含在源版本中,但它们不包含在二进制分发版中。可以在相应的小节中找到进一步的说明。

Apache Bahir 中的连接器

Flink 的其他流处理连接器正在通过 Apache Bahir 发布,包括:

其他连接到 Flink 的方法

通过异步 I / O 进行数据丰富

使用连接器不是将数据输入和输出 Flink 的唯一方法。一种常见的模式是在一个 Map 或多个 FlatMap 中查询外部数据库或 Web 服务以丰富主数据流。Flink 提供了一个用于 异步 I / O 的 API, 以便更有效,更稳健地进行这种丰富。

可查询状态

当 Flink 应用程序将大量数据推送到外部数据存储时,这可能会成为 I / O 瓶颈。如果所涉及的数据具有比写入更少的读取,则更好的方法可以是外部应用程序从 Flink 获取所需的数据。在 可查询的状态 界面,允许通过 Flink 被管理的状态,按需要查询支持这个。

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。