通过HParams和Tensorboard进行贝叶斯优化

如何解决通过HParams和Tensorboard进行贝叶斯优化

我目前正在使用HParams来发起网格搜索超参数优化会话,该会话运行良好,并且将日志输出到我的张量板HParams插件中,我可以看到各种不同的运行以及Parallel Co-Ordinates视图。代码的结构是这样的,尽管对于这个问题可能没有必要对其进行审查:

def hparam_wrap(args,n_classes,train_dataset,val_dataset,tokenizer):
    log_date_subfolder = time.strftime("%Y%m%d-%H%M%S")
    hparams_dict={
        'HP_EMBEDDING_NODES': hp.HParam('embedding_nodes',hp.Discrete([200,300])),'HP_LSTM_NODES': hp.HParam('lstm_nodes','HP_TIMEDIST_NODES': hp.HParam('timedist_nodes','HP_NUM_DENSE_LAYERS': hp.HParam('num_dense_layers',hp.Discrete([3,4,5])),'HP_DENSE_NODES': hp.HParam('dense_nodes',hp.Discrete([300,400,500])),'HP_LEARNING_RATE': hp.HParam('learning_rate',hp.Discrete([0.001,0.0001,0.00001])),'HP_DROPOUT': hp.HParam('dropout',hp.Discrete([0.3,0.4,0.5,0.6])),'HP_BATCH_SIZE': hp.HParam('batch_size',hp.Discrete([96]))
    }
    session_num = 0
    for en in hparams_dict['HP_EMBEDDING_NODES'].domain.values:
        for ln in hparams_dict['HP_LSTM_NODES'].domain.values:
            for td in hparams_dict['HP_TIMEDIST_NODES'].domain.values:
                for dl in hparams_dict['HP_NUM_DENSE_LAYERS'].domain.values:
                    for dn in hparams_dict['HP_DENSE_NODES'].domain.values:
                        for lr in hparams_dict['HP_LEARNING_RATE'].domain.values:
                            for do in hparams_dict['HP_DROPOUT'].domain.values:
                                for bs in hparams_dict['HP_BATCH_SIZE'].domain.values:
                                    hparams ={
                                        'HP_NUM_DENSE_LAYERS': dl,'HP_LEARNING_RATE': lr,'HP_DROPOUT': do,'HP_DENSE_NODES': dn,'HP_BATCH_SIZE': bs,'HP_EMBEDDING_NODES': en,'HP_LSTM_NODES': ln,'HP_TIMEDIST_NODES': td
                                    }
                                    run_name = "run-%d" % session_num
                                    print('--- Starting trial: %s' % run_name)
                                    print({h: hparams[h] for h in hparams})

                                    log_dir = os.path.join('s3://sn-classification',args.type,'Logs',args.country,args.subfolder,'HParams',log_date_subfolder)

                                    run_hparam(log_dir,hparams,hparams_dict,args,tokenizer)
                                    session_num += 1


def run_hparam(log_dir,tokenizer):
  with tf.summary.create_file_writer(log_dir).as_default():
    hp.hparams_config(
    hparams=list(hparams_dict.values()),metrics=[hp.Metric('val_top_k_categorical_accuracy',display_name='TopK_Val_Accuracy'),hp.Metric('val_loss',display_name='val_loss')]
  )
    # hp.hparams(hparams)  # record the values used in this trial
    hp.hparams({hparams_dict[h]: hparams[h] for h in hparams_dict.keys()})
    history = train(args,tokenizer)
    tf.summary.scalar('val_top_k_categorical_accuracy',history['val_top_k_categorical_accuracy'][-1],step=1)
    tf.summary.scalar('val_loss',history['val_loss'][-1],step=1)

我已经做了大量的谷歌搜索工作,但是我仍然不确定如何实施更有效的优化会话,例如贝叶斯优化,以便更快地找到最优模型。我唯一想知道的是-是否可以在HParams中进行贝叶斯优化,还是需要使用其他程序(如“权重”和“偏差”)?如果可能的话,任何有关在哪里找到这种实现方式示例的建议都将非常有帮助。

解决方法

这是一个长期的 open feature request,遗憾的是目前还没有在 HPARAMS 部分实现,但 Keras-tuner 将允许您记录每次运行的结果。将超参数值编码到这些目录名称中可能是一种快速而肮脏的解决方法。为了将来读者的利益,我在本答案的末尾提供了使用 TensorBoard 进行贝叶斯优化的指南。

我可能要补充一点,TensorBoard 可视化对于使用网格或随机搜索来通知开发人员的手动调整直觉很有用,但由于贝叶斯优化是一个独立的黑盒优化器,您应该能够让它在没有优化的情况下运行本身受到缺乏可视化的影响——尽管我同意这仍然是一个不错的功能。

为了在 TensorFlow 中实现贝叶斯优化并记录每次运行的损失,我为未来的读者提供以下内容:

首先定义一个 HyperParameters 对象 hp

from kerastuner.engine.hyperparameters import HyperParameters
hp = HyperParameters()

编写一个带参数 model_builderhp 函数,使用 hp.get('name') 将超参数合并到模型中。定义 Keras 调谐器 BayesianOptimization 调谐器。

import kerastuner as kt
tuner = kt.BayesianOptimization(model_builder,hyperparameters = hp,max_trials      = 20,objective       = 'val_loss')

在您的回调中包含 tf.keras.callbacks.TensorBoard(cb_dir) 以在目录 cb_dir 中记录 BaysianOptimiser 每次运行的损失图。这包括针对 epoch 的标量图,但不包括 HPARAMS 部分。您可能希望命名这些运行文件,以便它们列出超参数。

tuner.search(inputs,prices,validation_split = 0.2,batch_size       = 32,callbacks        = [tf.keras.callbacks.TensorBoard(cb_dir)],epochs           = 30)

通过

访问最高n得分超参数组合的字典
ith_best_hp_dict = tuner.get_best_hyperparameters(num_trials = n)[i]

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


依赖报错 idea导入项目后依赖报错,解决方案:https://blog.csdn.net/weixin_42420249/article/details/81191861 依赖版本报错:更换其他版本 无法下载依赖可参考:https://blog.csdn.net/weixin_42628809/a
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下 2021-12-03 13:33:33.927 ERROR 7228 [ main] o.s.b.d.LoggingFailureAnalysisReporter : *************************** APPL
错误1:gradle项目控制台输出为乱码 # 解决方案:https://blog.csdn.net/weixin_43501566/article/details/112482302 # 在gradle-wrapper.properties 添加以下内容 org.gradle.jvmargs=-Df
错误还原:在查询的过程中,传入的workType为0时,该条件不起作用 <select id="xxx"> SELECT di.id, di.name, di.work_type, di.updated... <where> <if test=&qu
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct redisServer’没有名为‘server_cpulist’的成员 redisSetCpuAffinity(server.server_cpulist); ^ server.c: 在函数‘hasActiveC
解决方案1 1、改项目中.idea/workspace.xml配置文件,增加dynamic.classpath参数 2、搜索PropertiesComponent,添加如下 <property name="dynamic.classpath" value="tru
删除根组件app.vue中的默认代码后报错:Module Error (from ./node_modules/eslint-loader/index.js): 解决方案:关闭ESlint代码检测,在项目根目录创建vue.config.js,在文件中添加 module.exports = { lin
查看spark默认的python版本 [root@master day27]# pyspark /home/software/spark-2.3.4-bin-hadoop2.7/conf/spark-env.sh: line 2: /usr/local/hadoop/bin/hadoop: No s
使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams['font.sans-serif'] = ['SimHei'] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -> systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping("/hires") public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate<String
使用vite构建项目报错 C:\Users\ychen\work>npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-