google-cloud-dataproc专题提供google-cloud-dataproc的最新资讯内容,帮你更好的了解google-cloud-dataproc。
我有一个在 GCP Dataproc 上运行的 Spark 2.4.7 和从 AWS S3 读取一些文件的任务。 在创建集群时将 AWS 凭
我有两个 GCP 项目。从头开始构建的测试环境和具有现有 Cloud SQL for MySQL 实例的生产环境。我的目标是使
google-dataproc 使用 pyspark.sql import SparkSession 不断崩溃,并显示“504。这是一个错误”并且没有任何笔记本
我正在尝试按分区读取 BQ 表,但在函数 <code>show</code> 和 <code>cache</code> 上出现错误。数据本身并不大,
我在从 Dataproc 中的 Jupyter 笔记本读取 Google Bucket 中的数据时遇到问题。在我的名为 <code>stb_data</code> 的 G
我正在计算引擎中从 sql server 实例创建一个管道,我想将此数据迁移到 bigquery,但在预览实例中一切正
我有一个最初部署到 us-central1 的 python 云函数。尝试将此函数部署到 us-east4 时,我在加载代码时收到以
我想创建一个具有 1 个主节点和 2 个工作节点的 dataproc 集群,但纱线站点属性“yarn.timeline-service.reader.we
所以,我在我的项目中使用了 <code>gcloud dataproc</code>、<code>Hive</code> 和 <code>Spark</code>,但我显然无法连
我正在 GCP Dataproc 集群上运行 Spark 作业,该集群配置有 1 个主工作器、2 个主要工作器(4 个本地 SSD,每
根据 <a href="https://cloud.google.com/data-fusion/docs/how-to/running-against-existing-dataproc#versions_62_and_above" rel="nofollow n
我有两个 pyspark 数据框 df1: <pre><code>person_id Name serialNo Maritalstatus Location_name 01 abc
尝试在 GCP 上运行“导入火炬”。 我收到消息 <code>ModuleNotFoundError: No module named &#39;torch&#39;</code>
在 google 云平台上使用 Hadoop Dataproc-Clusters 时,我不断收到消息“内核正在重新启动,内核 (...) 似乎已经
我想创建一个云函数 (HTTP) 以在 <code>Gcp DataProc</code> 集群中提交 Spark 作业。我创建了一个示例微服务,
我使用 Dataproc Metastore 作为 GCP 的 Metastore 服务。我如何与它交互以从中获取数据库和表的列表?是否可
我正在尝试使用 spark 程序从本地集群连接到 dataproc 集群。我将在本地系统中运行 spark 程序,以从驻留
我正在尝试使用 Cloud Composer 运算符创建 dataproc 集群。 这是我的 DAG 的样子: <pre><code>default_dag_args = {
我有一个以这种方式配置的 Dataproc 集群: <pre><code>{ &#34;worker_config&#34;: { &#34;num_instances&#34;:
我正在尝试使用 java 和 spark 从我的本地机器(eclipse)访问 GCP 中存在的 Hive 服务器 - Dataproc。但是我在