Nettoyer un historique git

Nettoyer un historique git

Travailler à partir d'un clone mirroire afin d'avoir la totalité du repository sous la main.

git clone --mirror git@bitbucket.org:project.git

Retrouver les fichiers les plus volumineux de l'historique

#!/bin/bash
#set -x 
 
# Shows you the largest objects in your repo's pack file.
# Written for osx.
#
# @see https://stubbisms.wordpress.com/2009/07/10/git-script-to-show-largest-pack-objects-and-trim-your-waist-line/
# @author Antony Stubbs
 
# set the internal field spereator to line break, so that we can iterate easily over the verify-pack output
IFS=$'\n';

echo "Exploring pack data, please wait ..."

# list all objects including their size, sort by size, take top 20
objects=`git verify-pack -v objects/pack/pack-*.idx | grep -v chain | sort -k3nr | head -n 20`
 
echo "All sizes are in kB's. The pack column is the size of the object, compressed, inside the pack file."
 
output="size,pack,SHA,location"
for y in $objects
do
    # extract the size in bytes
    size=$((`echo $y | cut -f 5 -d ' '`/1024))
    # extract the compressed size in bytes
    compressedSize=$((`echo $y | cut -f 6 -d ' '`/1024))
    # extract the SHA
    sha=`echo $y | cut -f 1 -d ' '`
    # find the objects location in the repository tree
    other=`git rev-list --all --objects | grep $sha`
    #lineBreak=`echo -e "\n"`
    output="${output}\n${size},${compressedSize},${other}"
done
 
echo -e $output | column -t -s ', '

Supprimer des fichiers

$ git filter-branch --index-filter 'git rm -r --cached --ignore-unmatch ./fileorfoldertoremove' --tag-name-filter cat -- --all

Remplacer des clefs d'authentification dans un historique git

$ git filter-branch --tree-filter "find . -type f -exec sed -i -e 's/originalpassword/newpassword/g' {} \;"

Cela peut aussi se faire pour un fichier spécifique afin de gagner du temps

$ git filter-branch --tree-filter "find . -name 'settings.py' -exec sed -i -e 's/originalpassword/newpassword/g' {} \;"

Nettoyer en local tout ce qui doit être supprimé

rm -rf refs/original/
git reflog expire --expire=now --all
git gc --prune=now
git gc --aggressive --prune=now

Pousser sur le repository distant

WARNING!!!
this will rewrite completely your bitbucket refs
will delete all branches that you didn't have in your local

git push --prune --force

Si vous travaillez avec un repository administré chez Bitbucket, sachez qu'un carbage collector doit encore passer derrière vous pour le repository distant. Celà devrait se faire à votre prochain push, sinon n'hésitez pas à contacter le support technique.