如何解决psycopg2将行插入为列
我不确定是否正确表达了这个意思,但是当从一个数据库查询数据并使用psycopg2
将其插入另一个数据库时,脚本有时会分解数据并插入行列(例如,每行每列打印一个字符),
name | id_2 | id_1 | blank | data
--------------+------------+-------------+--------------+--------------
A | 1 | a | | {json: data}
B | a | 1 | | {json: data}
C | 2 | b | | {json: data}
D | b | 2 | | {json: data}
E | 3 | c | | {json: data}
F | c | 3 | | {json: data}
我希望表格如下所示:
name | id_2 | id_1 | blank | data
--------------+------------+-------------+--------------+--------------
ABCDEF | 1a2b3c | a1b2c3 | | {json: data}
我要生成的代码是:
import psycopg2,uuid
id_1 = str(uuid.uuid4())
conn1 = psycopg2.connect(
host='host',database=db1,user='user',password='password')
conn2 = psycopg2.connect(
host='host',database=db2
user='user',password='password')
def generate_data(id_1,name,id_2):
data = {
"tag": name,"id_2": id_2,"id_1": id_1,"rand_int": random.randint(0,86400),"rand_uni_1": str(round(random.uniform(0.0,8.0),2)),"rand_uni_2": str(round(random.uniform(0.0,16.0),"digi": "","point_type": random.randint(0,1),"garbage_data": "garbage_data"
}
data_str = str(json.dumps(data).replace("'","''"))
add_data(name,id_2,id_1,data_str)
def add_data(name_rec,id_2_rec,id_1_rec,data_rec):
insert_data = "INSERT into table(name,data) VALUES (%s,%s,%s::jsonb) ON CONFLICT DO NOTHING;"
try:
cur = conn2.cursor()
cur.executemany(insert_data,zip(name_rec,data_rec))
conn2.commit()
cur.close()
except (Exception,psycopg2.DatabaseError) as error:
print(error)
finally:
if conn2 is not None:
conn2.close()
def query_data():
try:
create_data_table()
cur = conn1.cursor()
cur.execute("SELECT name,table_name FROM existing_table;")
data_returned = cur.fetchall()
name = [i[0] for i in data_returned]
old_table = [i[1] for i in data_returned]
for x in data_returned:
name = x[0]
new_id_2 = x[1][5:].replace("_","-")
generate_data(id_1_rec,new_id_2)
cur.close()
except (Exception,psycopg2.DatabaseError) as error:
print(error)
def create_data_table():
with conn2.cursor() as cursor:
cursor.execute(
"CREATE TABLE IF NOT EXISTS table "
"("
"name VARCHAR(100),"
"id_2 VARCHAR(50),"
"id_1 VARCHAR(50),"
"data JSONB"
");"
)
conn2.commit()
cursor.close()
create_data_table()
query_data()
我正在使用print语句来验证数据是否显示为应该插入表中。我在隔离与此代码有关jsonb
的另一个问题时发现了这一点,我将在下一个发布。一般来说,我对SQL和Python(以及psycopg2)比较陌生,因为它来自质量检查人员,因此对您的帮助非常感谢!
解决方法
今天早上站起来后,我抓到了一些开发人员,并解决了这个问题,如果不清楚,那就是如上所述如何将数据输入到数据库中。
这里的问题在于行cur.executemany(insert_data,zip(name_rec,id_2_rec,id_1_rec,data_rec))
-更具体地说是executemany
方法和zip()
函数。由于zip()
函数返回一个zip对象,该对象是元组的迭代器,其中每个传递的迭代器中的第一项(和所有后续项)都配对在一起,而{{1} }方法准备数据库操作(查询或命令),并针对序列seq_of_params 中找到的所有参数序列或映射执行该操作,这导致数据被逐字符输入到新表中。通过将行更改为executemany
可以解决此问题,现在我的数据应有应有的显示,即
cur.execute(insert_data,(name_rec,data_rec))
我为 messy 代码道歉,并且如果我最初没有正确阐明问题-我上音乐学校,大约2.5年前就进入了这个领域,担任QA,之前没有任何经验,所以这对我来说还是相对较新的。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。