关于cocomini数据集

我把cocomini数据集的annotations里面的cocomini.json文件用 with open ,json.load读入后,把相同图片的annotation合并到了同一个txt文件中,但是最终txt的数量和图片的数量不一样?不知道为啥,正确的应该是一样的,即一张图片对应一个txt,然后把它交给yolov3读取训练



这是合并后的txt

这是合并的代码
import os

d = dict()
for i in range(600000):
d[i] = ‘’
for idx,key in enumerate(dataset[‘annotations’]):
ca_id = key[‘category_id’]
bbox = key[‘bbox’]
img_id = key[‘image_id’]

s = ‘’

s = str(ca_id)

print(“S1 {}”.format(s))

for i in bbox:
    s += (' ' +  str(i)) 
s += '\n'
d[int(img_id)] += s

print(“id:{} str:{}”.format(img_id,d[img_id]))

del s

print(“f1”)
pth = “/home/megstudio/workspace/data/cocomini/labels_train/”

if os.path.isfile(pth+"{}.txt".format(img_id))

for i in d:
if d[i] != ‘’:
with open(pth+"{}.txt".format(i),‘w’) as f:
f.write(d[i])
print(‘f2’)

你好,非 MegEngine 框架本身设计存在的问题,不要在问题反馈区发帖哦。类似于这种使用上遇到的疑惑,建议在用户交流区发帖。我帮你把帖子移过来了。

:grinning:明白了

emmm 代码格式有点乱,能不能重新排版一下鸭。

问题解决了,是cocomini数据集里面存在没有anno的图片,所以图片数量大于txt的数量是正常的 :grinning:

1赞

很棒~ 要不要尝试把你加载 Coco mini 数据集的各种踩坑经历总结成一个帖子呀,这样可能会对其它入门的新手有帮助,现在官方也没有这方面的教程,没准可以把你的帖子纳入官方教程呢~

行呢,我给试着写写 :grinning:,写好了跟您说哈

我写完了柴老师,怎么给你发过去 :grinning:

直接用帖子的形式发在论坛就行了呀

行,我给试试 :joy:

那不行我给截个图?直接以截图的形式然后放在帖子里面发?还是我从写一次 :joy:

我把内容写在了notebook里面,这个论坛的帖子不能上传 :joy: