如何使用 Guice 将我的 api 注入数据流作业而无需可序列化?

如何解决如何使用 Guice 将我的 api 注入数据流作业而无需可序列化?

这个问题是继这么好的答案之后的后续问题Is there a way to upload jars for a dataflow job so we don't have to serialize everything?

这让我意识到“好吧,我想要的是没有序列化的注入,以便我可以模拟和测试”。

我们当前的方法要求我们的 apis/mocks 是可序列化的,但是,我必须将静态字段放入模拟中,因为它会被序列化和反序列化,从而创建数据流使用的新实例。

我的同事指出,也许这需要是一个水槽,但要区别对待?

我的愿望是在测试期间用模拟替换 API。有人有这方面的例子吗?

这是我们的引导程序代码,不知道它是在生产中还是在功能测试中。我们测试端到端的结果,在我们的测试中没有 apache 光束导入,这意味着如果我们想要调整并保留我们的所有测试,我们会切换到任何技术。不仅如此,我们还发现了更多的集成错误,并且可以在不重写测试的情况下进行重构,因为我们测试的合同是我们无法轻易更改的客户合同。

public class App {

    private Pipeline pipeline;
    private RosterFileTransform transform;

    @Inject
    public App(Pipeline pipeline,RosterFileTransform transform) {
        this.pipeline = pipeline;
        this.transform = transform;
    }


    public void start() {
        pipeline.apply(transform);
        pipeline.run();
    }
}

请注意,我们所做的一切都是基于 Guice 注入的,因此流水线可能是直接运行的,也可能不是。我可能需要修改这个类来传递东西 :( 但是现在任何有用的东西都会很棒。

我试图在没有序列化的情况下获取我们的 api(以及模拟和实现)的函数是

private class ValidRecordPublisher extends DoFn<Validated<PractitionerDataRecord>,String> {
    @ProcessElement
    public void processElement(@Element Validated<PractitionerDataRecord>element) {
        microServiceApi.writeRecord(element.getValue);
    }
}

我不确定如何以一种避免序列化的方式传入 microServiceApi。在使用 guice Provider provider 进行反序列化之后,我也可以延迟创建;使用 provider.get() 如果那里也有解决方案。

解决方法

以这样一种方式解决:模拟不再需要静态或序列化,因为玻璃桥接了数据流的世界(在生产和测试中)像这样

注意:我们公司还有一个额外的魔法,它通过从一个服务到另一个服务的标头并通过数据流传递其中的一些你可以忽略的东西(即 RouterRequest 请求 = Current.request( );)所以对于其他人,他们每次都必须将 projectId 传入 getInstance。

public abstract class DataflowClientFactory implements Serializable {
    private static final Logger log = LoggerFactory.getLogger(DataflowClientFactory.class);

    public static final String PROJECT_KEY = "projectKey";
    private transient static Injector injector;
    private transient static Module overrides;

    private static int counter = 0;

    public DataflowClientFactory() {
        counter++;
        log.info("creating again(usually due to deserialization). counter="+counter);
    }

    public static void injectOverrides(Module dfOverrides) {
        overrides = dfOverrides;
    }

    private synchronized void initialize(String project) {
        if(injector != null)
            return;

        /********************************************
         * The hardest part is this piece since this is specific to each Dataflow
         * so each project subclasses DataflowClientFactory
         * This solution is the best ONLY in the fact of time crunch and it works
         * decently for end to end testing without developers needing fancy
         * wrappers around mocks anymore.
         ***/
        Module module = loadProjectModule();

        Module modules = Modules.combine(module,new OrderlyDataflowModule(project));
        if(overrides != null) {
            modules = Modules.override(modules).with(overrides);
        }

        injector = Guice.createInjector(modules);
    }

    protected abstract Module loadProjectModule();

    public <T> T getInstance(Class<T> clazz) {
        if(!Current.isContextSet()) {
            throw new IllegalStateException("Someone on the stack is extending DoFn instead of OrderlyDoFn so you need to fix that first");
        }
        RouterRequest request = Current.request();
        String project = (String)request.requestState.get(PROJECT_KEY);

        initialize(project);
        return injector.getInstance(clazz);
    }

}
,

我想这可能不是您要找的东西,但是您的用例让我想到了使用工厂对象。它们可能取决于您传递的管道选项(即您的 PipelineOptions 对象),或某些其他配置对象。

也许是这样的:

class MicroserviceApiClientFactory implements Serializable {
  MicroserviceApiClientFactory(PipelineOptions options) {
    this.options = options;
  }

  public static MicroserviceApiClient getClient() {
    MyPipelineOptions specialOpts = options.as(MySpecialOptions.class);
    if (specialOpts.getMockMicroserviceApi()) {
      return new MockedMicroserviceApiClient(...); // Or whatever
    } else {
      return new MicroserviceApiClient(specialOpts.getMicroserviceEndpoint());  // Or whatever parameters it needs
    }
  }
}

对于您的 DoFns 和任何其他需要它的执行时对象,您将传递工厂:

private class ValidRecordPublisher extends DoFn<Validated<PractitionerDataRecord>,String> {
    ValidRecordPublisher(MicroserviceApiClientFactory msFactory) {
        this.msFactory = msFactory;
    }
    @ProcessElement
    public void processElement(@Element Validated<PractitionerDataRecord>element) {
        if (microServiceapi == null) microServiceApi = msFactory.getClient();
        microServiceApi.writeRecord(element.getValue);
    }
}

这应该允许您将模拟功能封装到单个类中,以便在管道执行时懒惰地创建您的模拟或客户端。

告诉我这是否符合您的要求,或者我们是否应该尝试进一步迭代。


我没有Guice的经验,所以不知道Guice的配置是否可以轻松跨越管道构建和管道执行(序列化/提交JAR等)之间的边界。


这应该是一个水槽吗?也许,如果您有一个外部服务,并且您正在写入它,您可以编写一个处理它的 PTransform - 但如何注入各种依赖项的问题仍然存在。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


依赖报错 idea导入项目后依赖报错,解决方案:https://blog.csdn.net/weixin_42420249/article/details/81191861 依赖版本报错:更换其他版本 无法下载依赖可参考:https://blog.csdn.net/weixin_42628809/a
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下 2021-12-03 13:33:33.927 ERROR 7228 [ main] o.s.b.d.LoggingFailureAnalysisReporter : *************************** APPL
错误1:gradle项目控制台输出为乱码 # 解决方案:https://blog.csdn.net/weixin_43501566/article/details/112482302 # 在gradle-wrapper.properties 添加以下内容 org.gradle.jvmargs=-Df
错误还原:在查询的过程中,传入的workType为0时,该条件不起作用 &lt;select id=&quot;xxx&quot;&gt; SELECT di.id, di.name, di.work_type, di.updated... &lt;where&gt; &lt;if test=&qu
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct redisServer’没有名为‘server_cpulist’的成员 redisSetCpuAffinity(server.server_cpulist); ^ server.c: 在函数‘hasActiveC
解决方案1 1、改项目中.idea/workspace.xml配置文件,增加dynamic.classpath参数 2、搜索PropertiesComponent,添加如下 &lt;property name=&quot;dynamic.classpath&quot; value=&quot;tru
删除根组件app.vue中的默认代码后报错:Module Error (from ./node_modules/eslint-loader/index.js): 解决方案:关闭ESlint代码检测,在项目根目录创建vue.config.js,在文件中添加 module.exports = { lin
查看spark默认的python版本 [root@master day27]# pyspark /home/software/spark-2.3.4-bin-hadoop2.7/conf/spark-env.sh: line 2: /usr/local/hadoop/bin/hadoop: No s
使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams[&#39;font.sans-serif&#39;] = [&#39;SimHei&#39;] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -&gt; systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping(&quot;/hires&quot;) public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate&lt;String
使用vite构建项目报错 C:\Users\ychen\work&gt;npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-