SQLite3:如何使用超过 200 个`FROM` 子句进行`LEFT JOIN`?

如何解决SQLite3:如何使用超过 200 个`FROM` 子句进行`LEFT JOIN`?

我正在尝试制定一个 SQLite 3 语句(使用 Python 的 sqlite3 库执行),该语句将一堆具有相同列和索引的表连接起来,以形成一个汇总所有数据的大表(最终将是输出为 CSV)。

脚本的问题部分如下所示。

with sqlite3.connect("database.db") as conn:
    # Create a statment to merge individual tables into one big table indexed by index_col,# with columns representing individual sets of values.
    all_column_names = ["<the tables' names,which will be column names in the final table>"]
    all_column_names_as = ",".join(f'{n}.value AS "{n}"' for n in all_column_names)
    all_joins = "\n".join(f"LEFT JOIN {n} ON {n}.index_col={all_column_names[0]}.index_name" for n in all_column_names[1::])
    select_statement = f"""
           SELECT {all_column_names[0]}.index_col,{all_column_names_as}
           FROM {all_column_names[0]}
           {all_joins};
        """
    # Execute the SELECT statement.
    conn.execute(select_statement)

为了更好地解释,这三个列表推导式创建了一些术语,这些术语组合成一个大的 SELECT 语句,然后执行。语句如下所示:

SELECT table_0.index_col,table_0.value AS table_0,table_1.value AS table_1,table_2.value AS table_2
FROM table_0
LEFT JOIN table_1 ON table_1.index_col=table_0.index_col
LEFT JOIN table_2 ON table_2.index_col=table_0.index_col;

较小的 table_0..2 表是这样创建的。

CREATE TABLE IF NOT EXISTS
   table_0 (
      index_col INTEGER PRIMARY KEY,value REAL
   );

这会生成一个如下所示的表格:

// E.g.,table_0; they all look like this.
index_col table_0
01        0.001     
02        0.5      
03        0.1   

// Final table
index_col table_0 table_1 table_2
01        0.001   0.0012  0.01   
02        0.5     0.62    0.67   
03        0.1     0.2     0.15

我遇到的问题与 FROMLEFT JOIN 子句的最大限制有关,即 200。

Traceback (most recent call last):
  File "<redacted>",line <redacted>,in execute
    cur.execute(*args,**kwargs)
sqlite3.OperationalError: too many FROM clause terms,max: 200

显然,这不是一种有效的方法,并且重新编译 SQLite 二进制文件以允许超过 200 个 FROM 子句是不可接受的。

我正在寻找能够计算相同最终表但不会失败的任何解决方案。如果这需要 LEFT JOIN 来制作部分表格,然后最后将它们组合起来,那没关系。如果有更好的方法来编写不会遇到限制的 SQL 语句,或者只是实现相同目的的不同 SQL 语句,那也很好。

背景: 之所以使用SQL,是因为我受RAM的限制;写入磁盘较慢,但允许我对数据进行操作,因为行像 Python 生成器一样返回。以前,尝试使用本机 Python 数据类型以及内存中的 Pandas DataFrame 生成然后连接数据导致我用完了 RAM,所以我不会在 Pandas(或其他库)中寻找解决方案,除非它实现起来要简单得多.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


依赖报错 idea导入项目后依赖报错,解决方案:https://blog.csdn.net/weixin_42420249/article/details/81191861 依赖版本报错:更换其他版本 无法下载依赖可参考:https://blog.csdn.net/weixin_42628809/a
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下 2021-12-03 13:33:33.927 ERROR 7228 [ main] o.s.b.d.LoggingFailureAnalysisReporter : *************************** APPL
错误1:gradle项目控制台输出为乱码 # 解决方案:https://blog.csdn.net/weixin_43501566/article/details/112482302 # 在gradle-wrapper.properties 添加以下内容 org.gradle.jvmargs=-Df
错误还原:在查询的过程中,传入的workType为0时,该条件不起作用 &lt;select id=&quot;xxx&quot;&gt; SELECT di.id, di.name, di.work_type, di.updated... &lt;where&gt; &lt;if test=&qu
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct redisServer’没有名为‘server_cpulist’的成员 redisSetCpuAffinity(server.server_cpulist); ^ server.c: 在函数‘hasActiveC
解决方案1 1、改项目中.idea/workspace.xml配置文件,增加dynamic.classpath参数 2、搜索PropertiesComponent,添加如下 &lt;property name=&quot;dynamic.classpath&quot; value=&quot;tru
删除根组件app.vue中的默认代码后报错:Module Error (from ./node_modules/eslint-loader/index.js): 解决方案:关闭ESlint代码检测,在项目根目录创建vue.config.js,在文件中添加 module.exports = { lin
查看spark默认的python版本 [root@master day27]# pyspark /home/software/spark-2.3.4-bin-hadoop2.7/conf/spark-env.sh: line 2: /usr/local/hadoop/bin/hadoop: No s
使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams[&#39;font.sans-serif&#39;] = [&#39;SimHei&#39;] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -&gt; systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping(&quot;/hires&quot;) public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate&lt;String
使用vite构建项目报错 C:\Users\ychen\work&gt;npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-