关于cocomini数据集

GF1225951553 · 2021年01月23日03:11

我把cocomini数据集的annotations里面的cocomini.json文件用 with open ,json.load读入后，把相同图片的annotation合并到了同一个txt文件中，但是最终txt的数量和图片的数量不一样？不知道为啥，正确的应该是一样的，即一张图片对应一个txt，然后把它交给yolov3读取训练

这是合并后的txt

这是合并的代码
import os

d = dict()
for i in range(600000):
d[i] = ‘’
for idx,key in enumerate(dataset[‘annotations’]):
ca_id = key[‘category_id’]
bbox = key[‘bbox’]
img_id = key[‘image_id’]

s = ‘’

s = str(ca_id)

print(“S1 {}”.format(s))

for i in bbox:
    s += (' ' +  str(i)) 
s += '\n'
d[int(img_id)] += s

print(“id:{} str:{}”.format(img_id,d[img_id]))

del s

print(“f1”)
pth = “/home/megstudio/workspace/data/cocomini/labels_train/”

if os.path.isfile(pth+"{}.txt".format(img_id))

for i in d:
if d[i] != ‘’:
with open(pth+"{}.txt".format(i),‘w’) as f:
f.write(d[i])
print(‘f2’)

Chai · 2021年01月23日03:12

你好，非 MegEngine 框架本身设计存在的问题，不要在问题反馈区发帖哦。类似于这种使用上遇到的疑惑，建议在用户交流区发帖。我帮你把帖子移过来了。

GF1225951553 · 2021年01月23日03:15

明白了

Chai · 2021年01月23日04:33

emmm 代码格式有点乱，能不能重新排版一下鸭。

GF1225951553 · 2021年01月23日06:30

问题解决了，是cocomini数据集里面存在没有anno的图片，所以图片数量大于txt的数量是正常的

Chai · 2021年01月23日06:32

很棒～要不要尝试把你加载 Coco mini 数据集的各种踩坑经历总结成一个帖子呀，这样可能会对其它入门的新手有帮助，现在官方也没有这方面的教程，没准可以把你的帖子纳入官方教程呢～

GF1225951553 · 2021年01月23日07:25

行呢，我给试着写写，写好了跟您说哈

GF1225951553 · 2021年01月24日02:09

我写完了柴老师，怎么给你发过去

Chai · 2021年01月24日02:10

直接用帖子的形式发在论坛就行了呀

GF1225951553 · 2021年01月24日02:13

行，我给试试

GF1225951553 · 2021年01月24日17:11

那不行我给截个图？直接以截图的形式然后放在帖子里面发？还是我从写一次

GF1225951553 · 2021年01月24日17:11

我把内容写在了notebook里面，这个论坛的帖子不能上传